Артифициальный интеллект, давай дружить
Tuesday, 6 January 2026 04:40 pm*
Маловато нас тут, на Дриме. Вот есть нужда у меня проконсультироваться, а разбирающиеся в теме граждане может и не переехали сюда из жж. В жж же писать уже не получается, перо, понимаешь, из пальцев выпадает.
А вопрос таков: хочу научиться делать хорошее видео силами ИИ, и вроде бы инструменты для этого более-менее уже допилились до приемлемого уровня.
Знаю я по этой теме ровно ноль, то есть вообще ничего не знаю.
С чего начать, откуда черпать Знание?
Понимаю, что соблазн послать меня на ютуб велик, но прошу от этого воздержаться, так как - не поверите! - на ютубе я уже был, и там мегатонны гуру вещают гигатонны истин. Проблем в этом две:
Маловато нас тут, на Дриме. Вот есть нужда у меня проконсультироваться, а разбирающиеся в теме граждане может и не переехали сюда из жж. В жж же писать уже не получается, перо, понимаешь, из пальцев выпадает.
А вопрос таков: хочу научиться делать хорошее видео силами ИИ, и вроде бы инструменты для этого более-менее уже допилились до приемлемого уровня.
Знаю я по этой теме ровно ноль, то есть вообще ничего не знаю.
С чего начать, откуда черпать Знание?
Понимаю, что соблазн послать меня на ютуб велик, но прошу от этого воздержаться, так как - не поверите! - на ютубе я уже был, и там мегатонны гуру вещают гигатонны истин. Проблем в этом две:
- 1 - Они вещают для тех, кто уже что-то знает, а если ты лох, то тебе не сюда
2 - Их овердохуя, и только перебор в поиске толкового гуру может занять месяцы
(да и как определить толковость гуру, будучи полным невеждой?)
no subject
Date: 2026-01-06 09:38 am (UTC)no subject
Date: 2026-01-06 09:51 am (UTC)Я бы начал даже не с ютьюба, а просто спросил ИИ с чего начать. Дальше уже уточнять по ходу дела.
Сегодня всё меняется так быстро, что Знанием обладают 10 человек на планете. Остальные что называется, tinkering, пока не начнёт выходить что-то более-менее приемлемое. И не факт, что это умение можно будет перенести на другую модель или продукт.
no subject
Date: 2026-01-06 12:34 pm (UTC)Спасибо, без иронии. Завтра же начну пытать иишенку.
no subject
Date: 2026-01-08 12:13 pm (UTC)no subject
Date: 2026-01-08 01:02 pm (UTC)- ... Но, поскольку Javascript я почти совсем не знаю, начать было пока тяжело.
- Чудо АИ состоит как раз в том, что яваскрипта знать не надо (я попрограммировал на нём, но этот код даже не читал), его за нас знает АИ. Я сейчас статьи с помощью АИ пишу во Французскую Википедию, и французы ко мне не придираются. Так и здесь, если умеешь описать то, что нужно, и указать АИ на его ошибки, то навыки собственно кодирования не обязательны.
Но за ИИ глаз да глаз нужен, он может иногда херню пороть.
no subject
Date: 2026-01-06 11:48 am (UTC)Локальные требуют кучи памяти (32 минимум), места (Гб 20-100-200) и видеокарту от 4060 и выше. Зато можно крутить когда угодно что угодно. Civitai хорошие модели, можно на huggingface посмотреть варианты.
no subject
Date: 2026-01-06 12:32 pm (UTC)Вопрос в том, чтобы разобраться, а не платить как лох за то, за что платить не надо, и при этом делать что-то, понимая что делаешь. В том, чтобы знать инструменты, а не тупо бросаться названьями (ну вот я знаю что есть такая нанабанана, и есть она же про, но есть ещё хуева куча - кажется, их называют агрегаторами - от н8н и Клинга до Хиггсфилда - для меня это просто слова, и я не вижу эту хуйню системно, то есть не понимаю, что для чего и как вся эта хуерга друг с другом соотносится и взаимодействует).
У меня есть комп, на котором я монтировал настоящие видео, он вытащит танк из болота: 128 RAM, 4090 GPU, опять же - вопрос в том, чтобы понимать, что к чему и видеть во всех этих блестящих словах систему.
Ну то есть, прям вот с азов. А все умные сука ютуберы исходят из того, что если не знаешь азов, то лузер и иди работай на заводе, точи болванки.
Теряюсь в море информации, бо тупо не знаю за что ухватиться, чтобы осознанно узнавать дальше то что мне нужно знать.
СОрри, наверно сумбурно написалось :)
no subject
Date: 2026-01-06 09:02 pm (UTC)есть такой интересный хак, что
если "свернуть" (т.е. тренинг на задачу классификации) картинки в многомерном визуальном пространстве с использованием языковых меток
то потом можно по языковым меткам-токенам "достать" визуальные образы из натренированного пространства
то есть юзер задаёт токены (используя изначальный токенайзер -- это типа словаря, их несколько штук, зависит от набора языков и от классификации токенов в словаре), некий специально заточенный под модель тензорный решатель на параллельном вычислителе решает некую задачу, в результате картинка, переводится в обычный формат
потом поверх прикручено покадровое изменение, опять же через промпт и наверное ризонинг, из картинок собирается видос
я лично начал изучение с генерации картинок через https://docs.comfy.org/installation/comfyui_portable_windows
загрузил 1.6 Гб, разархивил
это "станок" без модели и сопутствующей обвязки -- воркфлоу и модулей
воркфлоу это описание, как из промпта и моделей, модулями собирается... выход
модуль это кусок питон кода под свой шаг процесса
сразу простое воркфлоу -- просто генерация по тексту
есть воркфлоу -- использование маски и картинки-аналога, типа "нарисуй в том же стиле" или "сгенери заполнитель маски похожий по стилю на аналог"
я загрузил модель руками по инструкциям, запускаю из эксплорера батник run_nvidia_gpu.bat
а потом оказалось, что можно было Browse Templates и там будет выбор
описано в https://docs.comfy.org/interface/features/template
я юзаю 2 несвязанные модели (и соответственно 2 воркфлоу)
1 - https://github.com/martin-rizzo/ComfyUI-TinyBreaker -- там написано, как вкрячить
tinybreaker_prototype1.safetensors
t5xxl_fp8_e4m3fn.safetensors
и потом картинку скачать и дропнуть в окно браузера
2 - уже не помню где надыбал, stable diffusion 1.5
diffusion_pytorch_model.safetensors
картинка 1500х1000 рендерится около 20-25 секунд
no subject
Date: 2026-01-07 01:05 pm (UTC)no subject
Date: 2026-01-09 11:18 am (UTC)Если хотите консультации как поставить дома генераторы картинок посоветую, с видео вряд ли, SadTalker мы ставили вместе с чатом GPT попробуйте в общем Krea, Mage, Leonardo. Я просто советую то с чего сам начинал... Начинать с ComfyUI не очень советую, я сам в нём не очень это как садиться на формулу 1 или на танк для того чтобы научиться ездить на авто... У меня у самого Forge стоит.
Всё что я пытался в ИИ у меня в журнале по тегу https://twilightshade.dreamwidth.org/tag/%D0%B8%D0%B8