cathay_stray: (Default)
[personal profile] cathay_stray
*
Маловато нас тут, на Дриме. Вот есть нужда у меня проконсультироваться, а разбирающиеся в теме граждане может и не переехали сюда из жж. В жж же писать уже не получается, перо, понимаешь, из пальцев выпадает.

А вопрос таков: хочу научиться делать хорошее видео силами ИИ, и вроде бы инструменты для этого более-менее уже допилились до приемлемого уровня.
Знаю я по этой теме ровно ноль, то есть вообще ничего не знаю.

С чего начать, откуда черпать Знание?

Понимаю, что соблазн послать меня на ютуб велик, но прошу от этого воздержаться, так как - не поверите! - на ютубе я уже был, и там мегатонны гуру вещают гигатонны истин. Проблем в этом две:
    1 - Они вещают для тех, кто уже что-то знает, а если ты лох, то тебе не сюда
    2 - Их овердохуя, и только перебор в поиске толкового гуру может занять месяцы
         (да и как определить толковость гуру, будучи полным невеждой?)
Посоветуйте, кто что знает. Только если знаете, бо множить моё невежество не надо, его и так у меня есть.

Date: 2026-01-06 09:38 am (UTC)
From: [personal profile] parlancer
Я всего лишь читатель, но вот этот сайт хорош: https://civitai.com/articles

Date: 2026-01-06 09:51 am (UTC)
ak_47: (Default)
From: [personal profile] ak_47

Я бы начал даже не с ютьюба, а просто спросил ИИ с чего начать. Дальше уже уточнять по ходу дела.

Сегодня всё меняется так быстро, что Знанием обладают 10 человек на планете. Остальные что называется, tinkering, пока не начнёт выходить что-то более-менее приемлемое. И не факт, что это умение можно будет перенести на другую модель или продукт.

Date: 2026-01-08 12:13 pm (UTC)
burbilog: (Default)
From: [personal profile] burbilog
Только брать надо посвежее. GPT 5.2, Gemini 3 Pro, Opus 4.5. Потому что у тех что хотя бы на полгода постарше уже нехватает знания о текущей ситуации.

Date: 2026-01-08 01:02 pm (UTC)
e2pii1: (Default)
From: [personal profile] e2pii1
Присоединяюсь к совету. Например, пишут мои знакомые:

- ... Но, поскольку Javascript я почти совсем не знаю, начать было пока тяжело.
- Чудо АИ состоит как раз в том, что яваскрипта знать не надо (я попрограммировал на нём, но этот код даже не читал), его за нас знает АИ. Я сейчас статьи с помощью АИ пишу во Французскую Википедию, и французы ко мне не придираются. Так и здесь, если умеешь описать то, что нужно, и указать АИ на его ошибки, то навыки собственно кодирования не обязательны.

Но за ИИ глаз да глаз нужен, он может иногда херню пороть.

Date: 2026-01-06 11:48 am (UTC)
straktor: benders (Default)
From: [personal profile] straktor
Генерация видео может быть локальной или от сервиса-клауда. В сервисах продвинутые модели, но будет монетизация, а пока ограничения. Зато просто, пишешь промпт, генерит.

Локальные требуют кучи памяти (32 минимум), места (Гб 20-100-200) и видеокарту от 4060 и выше. Зато можно крутить когда угодно что угодно. Civitai хорошие модели, можно на huggingface посмотреть варианты.

Date: 2026-01-06 09:02 pm (UTC)
straktor: benders (Default)
From: [personal profile] straktor
никакой стройной Теории ИИ для генеративных моделей сейчас нету

есть такой интересный хак, что
если "свернуть" (т.е. тренинг на задачу классификации) картинки в многомерном визуальном пространстве с использованием языковых меток
то потом можно по языковым меткам-токенам "достать" визуальные образы из натренированного пространства

то есть юзер задаёт токены (используя изначальный токенайзер -- это типа словаря, их несколько штук, зависит от набора языков и от классификации токенов в словаре), некий специально заточенный под модель тензорный решатель на параллельном вычислителе решает некую задачу, в результате картинка, переводится в обычный формат

потом поверх прикручено покадровое изменение, опять же через промпт и наверное ризонинг, из картинок собирается видос

я лично начал изучение с генерации картинок через https://docs.comfy.org/installation/comfyui_portable_windows
загрузил 1.6 Гб, разархивил
это "станок" без модели и сопутствующей обвязки -- воркфлоу и модулей
воркфлоу это описание, как из промпта и моделей, модулями собирается... выход
модуль это кусок питон кода под свой шаг процесса
сразу простое воркфлоу -- просто генерация по тексту
есть воркфлоу -- использование маски и картинки-аналога, типа "нарисуй в том же стиле" или "сгенери заполнитель маски похожий по стилю на аналог"

я загрузил модель руками по инструкциям, запускаю из эксплорера батник run_nvidia_gpu.bat
а потом оказалось, что можно было Browse Templates и там будет выбор
описано в https://docs.comfy.org/interface/features/template

я юзаю 2 несвязанные модели (и соответственно 2 воркфлоу)
1 - https://github.com/martin-rizzo/ComfyUI-TinyBreaker -- там написано, как вкрячить
tinybreaker_prototype1.safetensors
t5xxl_fp8_e4m3fn.safetensors
и потом картинку скачать и дропнуть в окно браузера

2 - уже не помню где надыбал, stable diffusion 1.5
diffusion_pytorch_model.safetensors

картинка 1500х1000 рендерится около 20-25 секунд

Date: 2026-01-09 11:18 am (UTC)
twilightshade: (Default)
From: [personal profile] twilightshade
Смотря какое видео и на чём... Сначала нужно определиться ты будешь делать на своём компе или на стороннем ресурсе. Если на стороннем ресурсе всё жутко ограничено или платно. Даже та же Sora которая считается одним из лучших видеогенераторов платная... Второмй момент, буду дома делать пусть меня научат... Тут всё упирается в железо. Грубо говоря карта Nvidia RTX обязательна AMD RX последних серий можно но категорически не рекомендуется, не всё ИИ на ней пойдёт или через костыли (я вот мучаюсь). 8 гигабайт видеопамяти это минимальный пропуск в мир ИИ (но лучше 16, а оеративки от 32)... Что можно сделать дома... Вот примерно это. https://www.youtube.com/watch?v=oiyVVoFZcSM или вот 😂 https://www.youtube.com/shorts/aYEl2UUQq8U Эьто полностью ИИ Использовался SadTalker и генератор речи EdgeTTS с использованием скриптов питона и интерфейса gradio (врочем пайплайн для EdgeTTS мне написал ChatGPT). Но поставить их непросто для этого нужно уметь работать с гихабом, а главное с командной строкой. Но в целом если вы чайник рекомендую начать с картинок Krea.ai www.mage.space/ leonardo.ai https://sora.chatgpt.com там есть и видео, но у chatgpt оно платно у остальных ограниченно, у Krea например можно, krea очень крутой сервис... Если появятся какие вопросы то лучше задавать их мощным моделям искусственного интелллекта таким как Gemini ChatGPT или Grock. Они и будут вашими гуру. Я в видео-ИИ не очень разбираюсь (ну кроме того что уже написал) я больше по генеративкам и немного по LLM...

Если хотите консультации как поставить дома генераторы картинок посоветую, с видео вряд ли, SadTalker мы ставили вместе с чатом GPT попробуйте в общем Krea, Mage, Leonardo. Я просто советую то с чего сам начинал... Начинать с ComfyUI не очень советую, я сам в нём не очень это как садиться на формулу 1 или на танк для того чтобы научиться ездить на авто... У меня у самого Forge стоит.

Всё что я пытался в ИИ у меня в журнале по тегу https://twilightshade.dreamwidth.org/tag/%D0%B8%D0%B8
Edited Date: 2026-01-09 11:44 am (UTC)

Profile

cathay_stray: (Default)
cathay_stray

January 2026

S M T W T F S
    123
45 678 910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Friday, 9 January 2026 01:48 pm
Powered by Dreamwidth Studios