cathay_stray | Артифициальный интеллект, давай дружить

*
Маловато нас тут, на Дриме. Вот есть нужда у меня проконсультироваться, а разбирающиеся в теме граждане может и не переехали сюда из жж. В жж же писать уже не получается, перо, понимаешь, из пальцев выпадает.

А вопрос таков: хочу научиться делать хорошее видео силами ИИ, и вроде бы инструменты для этого более-менее уже допилились до приемлемого уровня.
Знаю я по этой теме ровно ноль, то есть вообще ничего не знаю.

С чего начать, откуда черпать Знание?

Понимаю, что соблазн послать меня на ютуб велик, но прошу от этого воздержаться, так как - не поверите! - на ютубе я уже был, и там мегатонны гуру вещают гигатонны истин. Проблем в этом две:

Посоветуйте, кто что знает. Только если знаете, бо множить моё невежество не надо, его и так у меня есть.

Flat | Top-Level Comments Only

From:

parlancer

Я всего лишь читатель, но вот этот сайт хорош: https://civitai.com/articles

From:

ak_47

Я бы начал даже не с ютьюба, а просто спросил ИИ с чего начать. Дальше уже уточнять по ходу дела.

Сегодня всё меняется так быстро, что Знанием обладают 10 человек на планете. Остальные что называется, tinkering, пока не начнёт выходить что-то более-менее приемлемое. И не факт, что это умение можно будет перенести на другую модель или продукт.

From:

cathay_stray

Мысль спросить у ясеня меня при всей очевидности не посетила! О курва. А надо будет озаботиться.
Спасибо, без иронии. Завтра же начну пытать иишенку.

From:

burbilog

Только брать надо посвежее. GPT 5.2, Gemini 3 Pro, Opus 4.5. Потому что у тех что хотя бы на полгода постарше уже нехватает знания о текущей ситуации.

From:

e2pii1

Присоединяюсь к совету. Например, пишут мои знакомые:

- ... Но, поскольку Javascript я почти совсем не знаю, начать было пока тяжело.
- Чудо АИ состоит как раз в том, что яваскрипта знать не надо (я попрограммировал на нём, но этот код даже не читал), его за нас знает АИ. Я сейчас статьи с помощью АИ пишу во Французскую Википедию, и французы ко мне не придираются. Так и здесь, если умеешь описать то, что нужно, и указать АИ на его ошибки, то навыки собственно кодирования не обязательны.

Но за ИИ глаз да глаз нужен, он может иногда херню пороть.

From:

straktor

Генерация видео может быть локальной или от сервиса-клауда. В сервисах продвинутые модели, но будет монетизация, а пока ограничения. Зато просто, пишешь промпт, генерит.

Локальные требуют кучи памяти (32 минимум), места (Гб 20-100-200) и видеокарту от 4060 и выше. Зато можно крутить когда угодно что угодно. Civitai хорошие модели, можно на huggingface посмотреть варианты.

From:

cathay_stray

Если надо будет заплатить, я заплачу. Не в том вопрос.
Вопрос в том, чтобы разобраться, а не платить как лох за то, за что платить не надо, и при этом делать что-то, понимая что делаешь. В том, чтобы знать инструменты, а не тупо бросаться названьями (ну вот я знаю что есть такая нанабанана, и есть она же про, но есть ещё хуева куча - кажется, их называют агрегаторами - от н8н и Клинга до Хиггсфилда - для меня это просто слова, и я не вижу эту хуйню системно, то есть не понимаю, что для чего и как вся эта хуерга друг с другом соотносится и взаимодействует).

У меня есть комп, на котором я монтировал настоящие видео, он вытащит танк из болота: 128 RAM, 4090 GPU, опять же - вопрос в том, чтобы понимать, что к чему и видеть во всех этих блестящих словах систему.

Ну то есть, прям вот с азов. А все умные сука ютуберы исходят из того, что если не знаешь азов, то лузер и иди работай на заводе, точи болванки.

Теряюсь в море информации, бо тупо не знаю за что ухватиться, чтобы осознанно узнавать дальше то что мне нужно знать.
СОрри, наверно сумбурно написалось :)

From:

straktor

никакой стройной Теории ИИ для генеративных моделей сейчас нету

есть такой интересный хак, что
если "свернуть" (т.е. тренинг на задачу классификации) картинки в многомерном визуальном пространстве с использованием языковых меток
то потом можно по языковым меткам-токенам "достать" визуальные образы из натренированного пространства

то есть юзер задаёт токены (используя изначальный токенайзер -- это типа словаря, их несколько штук, зависит от набора языков и от классификации токенов в словаре), некий специально заточенный под модель тензорный решатель на параллельном вычислителе решает некую задачу, в результате картинка, переводится в обычный формат

потом поверх прикручено покадровое изменение, опять же через промпт и наверное ризонинг, из картинок собирается видос

я лично начал изучение с генерации картинок через https://docs.comfy.org/installation/comfyui_portable_windows
загрузил 1.6 Гб, разархивил
это "станок" без модели и сопутствующей обвязки -- воркфлоу и модулей
воркфлоу это описание, как из промпта и моделей, модулями собирается... выход
модуль это кусок питон кода под свой шаг процесса
сразу простое воркфлоу -- просто генерация по тексту
есть воркфлоу -- использование маски и картинки-аналога, типа "нарисуй в том же стиле" или "сгенери заполнитель маски похожий по стилю на аналог"

я загрузил модель руками по инструкциям, запускаю из эксплорера батник run_nvidia_gpu.bat
а потом оказалось, что можно было Browse Templates и там будет выбор
описано в https://docs.comfy.org/interface/features/template

я юзаю 2 несвязанные модели (и соответственно 2 воркфлоу)
1 - https://github.com/martin-rizzo/ComfyUI-TinyBreaker -- там написано, как вкрячить
tinybreaker_prototype1.safetensors
t5xxl_fp8_e4m3fn.safetensors
и потом картинку скачать и дропнуть в окно браузера

2 - уже не помню где надыбал, stable diffusion 1.5
diffusion_pytorch_model.safetensors

картинка 1500х1000 рендерится около 20-25 секунд

From:

cathay_stray

Большое спасибо, я был занят весь день (и буду завтра) - не мог даже прочитать до конца, завтра как освобожусь. Спасибо!

From:

cathay_stray

Кстати, вопрос по ходу: я хотел бы показать, примерно в каком направлении я надеюсь развиваться в ИИ-видео, но пока не знаю куда для Дрима народ загружает фото и короткие видосы. У Дрима ведь нет своего файлохранилища? Чем обычно пользуются дримюзеры? У меня есть пара коротеньких видосиков из китайской сети, я бы их выложил...

From:

cathay_stray

Прошу взглянуть на это видео (ссыль будет жива 24 часа, потом пропадёт) -
https://jumpshare.com/s/wZ5ibw37UbHLW4PZHjVd
Вот примерно к этому я хочу прийти.

Насколько это выполнимо (глупый вопрос! - выполнимо всё!) ну ладно, насколько это достижимо в рамках здравого расхода времени и денег? Какими инструментами это достижимо? Нянябаняня? Или что?
Я провёл всё свободное время в течение последних неск дней тупо смотря видео на ютубе, как люди что-то подобное делают, и попал в типичную ловушку новичка: ни хера не понял, ни хера не запомнил, в голове шум и пошло бы оно в пизду, выпьем с горя. Я понимаю, что это пройдёт :) но хочу мнения знающего человека! :)

From:

twilightshade

Смотря какое видео и на чём... Сначала нужно определиться ты будешь делать на своём компе или на стороннем ресурсе. Если на стороннем ресурсе всё жутко ограничено или платно. Даже та же Sora которая считается одним из лучших видеогенераторов платная... Второмй момент, буду дома делать пусть меня научат... Тут всё упирается в железо. Грубо говоря карта Nvidia RTX обязательна AMD RX последних серий можно но категорически не рекомендуется, не всё ИИ на ней пойдёт или через костыли (я вот мучаюсь). 8 гигабайт видеопамяти это минимальный пропуск в мир ИИ (но лучше 16, а оеративки от 32)... Что можно сделать дома... Вот примерно это. https://www.youtube.com/watch?v=oiyVVoFZcSM или вот 😂 https://www.youtube.com/shorts/aYEl2UUQq8U Эьто полностью ИИ Использовался SadTalker и генератор речи EdgeTTS с использованием скриптов питона и интерфейса gradio (врочем пайплайн для EdgeTTS мне написал ChatGPT). Но поставить их непросто для этого нужно уметь работать с гихабом, а главное с командной строкой. Но в целом если вы чайник рекомендую начать с картинок Krea.ai www.mage.space/ leonardo.ai https://sora.chatgpt.com там есть и видео, но у chatgpt оно платно у остальных ограниченно, у Krea например можно, krea очень крутой сервис... Если появятся какие вопросы то лучше задавать их мощным моделям искусственного интелллекта таким как Gemini ChatGPT или Grock. Они и будут вашими гуру. Я в видео-ИИ не очень разбираюсь (ну кроме того что уже написал) я больше по генеративкам и немного по LLM...

Если хотите консультации как поставить дома генераторы картинок посоветую, с видео вряд ли, SadTalker мы ставили вместе с чатом GPT попробуйте в общем Krea, Mage, Leonardo. Я просто советую то с чего сам начинал... Начинать с ComfyUI не очень советую, я сам в нём не очень это как садиться на формулу 1 или на танк для того чтобы научиться ездить на авто... У меня у самого Forge стоит.

Всё что я пытался в ИИ у меня в журнале по тегу https://twilightshade.dreamwidth.org/tag/%D0%B8%D0%B8

Edited Date: 2026-01-09 11:44 am (UTC)

From:

cathay_stray

Сорри, был занят - отвлекался от дел на всякую мелкую хрень, а для серьёзных вещей будет время только завтра. Всё изучу! Спасибо!

From:

twilightshade

Спрашивайте если что...

From:

cathay_stray

То, к чему я стремлюсь (нет, это конечно не предел, но если я смогу в пределах пары месяцев научиться делать ТАК, то буду молодец):
https://jumpshare.com/s/wZ5ibw37UbHLW4PZHjVd
Ссыль будет жива 24 часа, потом сдохнет.

Я там выше говорил, что комп у меня есть отдельный для видеоредактирования, где установлены нетрадиционные 128 Гб оперативы и где стоит 4090. Он, правда, отлучён от интернета, но это хоть и не хотелось бы, но можно поправить. Конечно, я всегда выберу вариант "на своём железе", но понимаю, что это скорее всего уже просто невыполнимо.

Очень хотелось бы услышать мнение о выложенном видосе!

From:

twilightshade

Не успел посмотреть ссыль (лучше бы на ютуб куда-нибудь). Но если вы хотите именно видео и только видео, то мои знания и помощь помощь тут увы ограничена, вы видели мои образцы с SadTalker? Я выкладывал. То есть любой человеческий аватар (тоже сгенерированный впрочем какой угодно) говорящий текст вы можете попробовать. Собственно говоря с такой картой как у вас чем больше всякого ИИ тем лучше. Тут следует не забывать ещё и о месте на диске 300-500 мегабайт где-то так... И лучше на основном SSD. Sad talker можно поставить с гитхаба вот отсюда например https://github.com/OpenTalker/SadTalker... Какой текст тут тоже есть варианты у меня например пайплайн EdgeTTS от Microsoft т.е. это уже не на компьютере а через интернет... А SadTalker он free.

From:

cathay_stray

Жалко. Не, на ютуп я выкладывать не буду, у меня там полузаброшенный аккаунт есть, но там мои ранние рекламные видосы, они мне можно сказать как память дороги, не хочу мешать с ними всякую херь. Если вам - ~~блядь да сил нет уже, давайте отбросим эту дурацкую привычку :) - "это интернет, детка", тут надо тыкать, ОК?~~ - любопытно, я могу снова залить этот клипок в какой-нибудь кратковременный депозиторий. Клипок на самом деле недурной.

Да, я целюсь на видео, причём на фотореалистичные видео, это сейчас для меня единственная возможность продолжить загибающийся видеобизнес.

Упомянутые выше печальные говоруны, гитхабы и прочее это для меня такой (и настолько) тёмный лес, что вотя пишу это и испытываю горячее желание допить кофий, докурить сигариллу, пойти на балкон и хуйнуть себя вниз от отчаянья.
Ладно, будем посмотреть. Может, и не хуйну!

From:

twilightshade

Тогда вам только во внешние платники... Midjourney советую, слишком банально... Вот

https://www.midjourney.com
https://sora.chatgpt.com
https://www.krea.ai
https://www.klingai.com
https://hailuoai.video/

Если знаете что такое промпты и промптинг, то уже можно начинать делать видео, если нет, то начните со статичных картинок на Sora и Krea...

From:

zlata_gl

Я потихонькау собираю "ленту".
Оставайтесь с нами !

From:

cathay_stray

Да тута я :)

Flat | Top-Level Comments Only

Profile

cathay_stray

April 2026

S	M	T	W	T	F	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Page Summary

Style Credit

Style: Green Rain for Paletteable by branchandroot
Resources: Mermaid Ashore

Expand Cut Tags

No cut tags

Page generated Saturday, 2 May 2026 06:22 am

红宝书

向CATHAY_STRAY同志学习!

Артифициальный интеллект, давай дружить

Артифициальный интеллект, давай дружить

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

April 2026

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags