cathay_stray: (Default)
[personal profile] cathay_stray
*
Маловато нас тут, на Дриме. Вот есть нужда у меня проконсультироваться, а разбирающиеся в теме граждане может и не переехали сюда из жж. В жж же писать уже не получается, перо, понимаешь, из пальцев выпадает.

А вопрос таков: хочу научиться делать хорошее видео силами ИИ, и вроде бы инструменты для этого более-менее уже допилились до приемлемого уровня.
Знаю я по этой теме ровно ноль, то есть вообще ничего не знаю.

С чего начать, откуда черпать Знание?

Понимаю, что соблазн послать меня на ютуб велик, но прошу от этого воздержаться, так как - не поверите! - на ютубе я уже был, и там мегатонны гуру вещают гигатонны истин. Проблем в этом две:
    1 - Они вещают для тех, кто уже что-то знает, а если ты лох, то тебе не сюда
    2 - Их овердохуя, и только перебор в поиске толкового гуру может занять месяцы
         (да и как определить толковость гуру, будучи полным невеждой?)
Посоветуйте, кто что знает. Только если знаете, бо множить моё невежество не надо, его и так у меня есть.

Date: 2026-01-06 09:38 am (UTC)
From: [personal profile] parlancer
Я всего лишь читатель, но вот этот сайт хорош: https://civitai.com/articles

Date: 2026-01-06 09:51 am (UTC)
ak_47: (Default)
From: [personal profile] ak_47

Я бы начал даже не с ютьюба, а просто спросил ИИ с чего начать. Дальше уже уточнять по ходу дела.

Сегодня всё меняется так быстро, что Знанием обладают 10 человек на планете. Остальные что называется, tinkering, пока не начнёт выходить что-то более-менее приемлемое. И не факт, что это умение можно будет перенести на другую модель или продукт.

Date: 2026-01-08 12:13 pm (UTC)
burbilog: (Default)
From: [personal profile] burbilog
Только брать надо посвежее. GPT 5.2, Gemini 3 Pro, Opus 4.5. Потому что у тех что хотя бы на полгода постарше уже нехватает знания о текущей ситуации.

Date: 2026-01-08 01:02 pm (UTC)
e2pii1: (Default)
From: [personal profile] e2pii1
Присоединяюсь к совету. Например, пишут мои знакомые:

- ... Но, поскольку Javascript я почти совсем не знаю, начать было пока тяжело.
- Чудо АИ состоит как раз в том, что яваскрипта знать не надо (я попрограммировал на нём, но этот код даже не читал), его за нас знает АИ. Я сейчас статьи с помощью АИ пишу во Французскую Википедию, и французы ко мне не придираются. Так и здесь, если умеешь описать то, что нужно, и указать АИ на его ошибки, то навыки собственно кодирования не обязательны.

Но за ИИ глаз да глаз нужен, он может иногда херню пороть.

Date: 2026-01-06 11:48 am (UTC)
straktor: benders (Default)
From: [personal profile] straktor
Генерация видео может быть локальной или от сервиса-клауда. В сервисах продвинутые модели, но будет монетизация, а пока ограничения. Зато просто, пишешь промпт, генерит.

Локальные требуют кучи памяти (32 минимум), места (Гб 20-100-200) и видеокарту от 4060 и выше. Зато можно крутить когда угодно что угодно. Civitai хорошие модели, можно на huggingface посмотреть варианты.

Date: 2026-01-06 09:02 pm (UTC)
straktor: benders (Default)
From: [personal profile] straktor
никакой стройной Теории ИИ для генеративных моделей сейчас нету

есть такой интересный хак, что
если "свернуть" (т.е. тренинг на задачу классификации) картинки в многомерном визуальном пространстве с использованием языковых меток
то потом можно по языковым меткам-токенам "достать" визуальные образы из натренированного пространства

то есть юзер задаёт токены (используя изначальный токенайзер -- это типа словаря, их несколько штук, зависит от набора языков и от классификации токенов в словаре), некий специально заточенный под модель тензорный решатель на параллельном вычислителе решает некую задачу, в результате картинка, переводится в обычный формат

потом поверх прикручено покадровое изменение, опять же через промпт и наверное ризонинг, из картинок собирается видос

я лично начал изучение с генерации картинок через https://docs.comfy.org/installation/comfyui_portable_windows
загрузил 1.6 Гб, разархивил
это "станок" без модели и сопутствующей обвязки -- воркфлоу и модулей
воркфлоу это описание, как из промпта и моделей, модулями собирается... выход
модуль это кусок питон кода под свой шаг процесса
сразу простое воркфлоу -- просто генерация по тексту
есть воркфлоу -- использование маски и картинки-аналога, типа "нарисуй в том же стиле" или "сгенери заполнитель маски похожий по стилю на аналог"

я загрузил модель руками по инструкциям, запускаю из эксплорера батник run_nvidia_gpu.bat
а потом оказалось, что можно было Browse Templates и там будет выбор
описано в https://docs.comfy.org/interface/features/template

я юзаю 2 несвязанные модели (и соответственно 2 воркфлоу)
1 - https://github.com/martin-rizzo/ComfyUI-TinyBreaker -- там написано, как вкрячить
tinybreaker_prototype1.safetensors
t5xxl_fp8_e4m3fn.safetensors
и потом картинку скачать и дропнуть в окно браузера

2 - уже не помню где надыбал, stable diffusion 1.5
diffusion_pytorch_model.safetensors

картинка 1500х1000 рендерится около 20-25 секунд

Date: 2026-01-09 11:18 am (UTC)
twilightshade: (Default)
From: [personal profile] twilightshade
Смотря какое видео и на чём... Сначала нужно определиться ты будешь делать на своём компе или на стороннем ресурсе. Если на стороннем ресурсе всё жутко ограничено или платно. Даже та же Sora которая считается одним из лучших видеогенераторов платная... Второмй момент, буду дома делать пусть меня научат... Тут всё упирается в железо. Грубо говоря карта Nvidia RTX обязательна AMD RX последних серий можно но категорически не рекомендуется, не всё ИИ на ней пойдёт или через костыли (я вот мучаюсь). 8 гигабайт видеопамяти это минимальный пропуск в мир ИИ (но лучше 16, а оеративки от 32)... Что можно сделать дома... Вот примерно это. https://www.youtube.com/watch?v=oiyVVoFZcSM или вот 😂 https://www.youtube.com/shorts/aYEl2UUQq8U Эьто полностью ИИ Использовался SadTalker и генератор речи EdgeTTS с использованием скриптов питона и интерфейса gradio (врочем пайплайн для EdgeTTS мне написал ChatGPT). Но поставить их непросто для этого нужно уметь работать с гихабом, а главное с командной строкой. Но в целом если вы чайник рекомендую начать с картинок Krea.ai www.mage.space/ leonardo.ai https://sora.chatgpt.com там есть и видео, но у chatgpt оно платно у остальных ограниченно, у Krea например можно, krea очень крутой сервис... Если появятся какие вопросы то лучше задавать их мощным моделям искусственного интелллекта таким как Gemini ChatGPT или Grock. Они и будут вашими гуру. Я в видео-ИИ не очень разбираюсь (ну кроме того что уже написал) я больше по генеративкам и немного по LLM...

Если хотите консультации как поставить дома генераторы картинок посоветую, с видео вряд ли, SadTalker мы ставили вместе с чатом GPT попробуйте в общем Krea, Mage, Leonardo. Я просто советую то с чего сам начинал... Начинать с ComfyUI не очень советую, я сам в нём не очень это как садиться на формулу 1 или на танк для того чтобы научиться ездить на авто... У меня у самого Forge стоит.

Всё что я пытался в ИИ у меня в журнале по тегу https://twilightshade.dreamwidth.org/tag/%D0%B8%D0%B8
Edited Date: 2026-01-09 11:44 am (UTC)

Date: 2026-01-12 11:35 am (UTC)
twilightshade: (Default)
From: [personal profile] twilightshade
Спрашивайте если что...

Date: 2026-01-13 02:52 pm (UTC)
twilightshade: (Default)
From: [personal profile] twilightshade
Не успел посмотреть ссыль (лучше бы на ютуб куда-нибудь). Но если вы хотите именно видео и только видео, то мои знания и помощь помощь тут увы ограничена, вы видели мои образцы с SadTalker? Я выкладывал. То есть любой человеческий аватар (тоже сгенерированный впрочем какой угодно) говорящий текст вы можете попробовать. Собственно говоря с такой картой как у вас чем больше всякого ИИ тем лучше. Тут следует не забывать ещё и о месте на диске 300-500 мегабайт где-то так... И лучше на основном SSD. Sad talker можно поставить с гитхаба вот отсюда например https://github.com/OpenTalker/SadTalker... Какой текст тут тоже есть варианты у меня например пайплайн EdgeTTS от Microsoft т.е. это уже не на компьютере а через интернет... А SadTalker он free.

Date: 2026-01-15 05:45 pm (UTC)
twilightshade: (Default)
From: [personal profile] twilightshade
Тогда вам только во внешние платники... Midjourney советую, слишком банально... Вот

https://www.midjourney.com
https://sora.chatgpt.com
https://www.krea.ai
https://www.klingai.com
https://hailuoai.video/

Если знаете что такое промпты и промптинг, то уже можно начинать делать видео, если нет, то начните со статичных картинок на Sora и Krea...

Date: 2026-01-09 05:47 pm (UTC)
zlata_gl: (Default)
From: [personal profile] zlata_gl
Я потихонькау собираю "ленту".
Оставайтесь с нами !

Profile

cathay_stray: (Default)
cathay_stray

April 2026

S M T W T F S
   1234
567891011
1213 1415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Saturday, 2 May 2026 06:22 am
Powered by Dreamwidth Studios