LTX-2: как начать пользоваться открытым генератором видео от Lightricks

LTX-2 -- первая в мире open-source модель с генерацией 4K-видео и синхронного звука в одном проходе. Занимает 2-е место на Arena ELO. Полный гайд по установке и первому запуску.

2026-06-13·8 мин

LTX-2.3 (5 марта 2026): актуальная версия. Lightricks выпустила LTX-2.3 с 22 миллиардами параметров -- новый VAE, улучшенное аудио, поддержка вертикального формата 9:16, пространственный и временной апскейлеры. Дистиллированный вариант: генерация за 8 шагов. Остаётся единственной открытой моделью с нативной генерацией 4K при 50 кадрах в секунду.

LTX Trainer (июнь 2026). Unified Trainer с 13 режимами обучения -- видео, аудио и кросс-модальные цели из единого конфига.

Что это и для кого

LTX-2 -- это открытая (open-source) модель генерации видео от израильской компании Lightricks, создателей популярных мобильных приложений для обработки фото и видео. Актуальная версия модели -- LTX-2.3, вышедшая 5 марта 2026 года с масштабными улучшениями.

Главная особенность LTX-2, которая выделяет её на фоне конкурентов: это первая производственно-готовая модель, которая генерирует 4K-видео и синхронизированный звук в одном проходе -- без промежуточных этапов, без отдельного шага для аудио. До LTX-2 создателям контента приходилось либо добавлять звук вручную в видеоредакторе, либо пользоваться закрытыми коммерческими сервисами вроде Google Veo 3. Оба подхода требовали времени, навыков или денег.

Модель полностью открыта: опубликованы веса, архитектура и обучающий код под лицензией Apache 2.0. Это значит, что вы можете запустить её локально на своём компьютере, дообучить на собственных данных или встроить в коммерческие продукты без каких-либо лицензионных отчислений. Для базового запуска достаточно видеокарты с 12 ГБ видеопамяти, например RTX 3080 или RTX 4070.

Кому подойдёт LTX-2:

Создателям контента, которые хотят бесплатно генерировать видеоролики с музыкой и звуками для YouTube, TikTok или Instagram.
Разработчикам, которым нужна локальная модель для встраивания в SaaS-продукты или автоматизации видеопроизводства.
Видеографам и аниматорам, которые ищут альтернативу дорогим коммерческим сервисам и хотят сохранять полный контроль над результатом.
Исследователям, которые изучают диффузионные модели и хотят дообучать LTX-2 на специализированных данных.
Всем, кто заботится о приватности: при локальном запуске ни одна ваша видеозаготовка не покидает ваш компьютер.

Важный контекст: LTX-2 вышла в период, когда рынок AI-видео бурно растёт. Закрытые решения -- Kling, Runway, Sora -- требуют подписки и отправляют данные на серверы компании. LTX-2 меняет уравнение, давая сопоставимое качество бесплатно и локально.

Как зарегистрироваться / установить

Так как LTX-2 -- это открытая модель, «регистрация» здесь означает выбор способа запуска. Есть три основных варианта: облачный тест через Hugging Face, локальный запуск через ComfyUI (рекомендуется для большинства пользователей) и установка через Python CLI для разработчиков.

Вариант 1: через Hugging Face Spaces (облачный тест, бесплатно)

Самый простой способ попробовать модель без каких-либо установок. Откройте сайт huggingface.co, зарегистрируйтесь (достаточно email-адреса), затем найдите пространство «LTX-2 Lightricks» через поисковую строку на сайте. Нажмите кнопку запуска и введите текстовый промпт. Демо запустит генерацию прямо в браузере. Ограничения: облачный запуск медленнее (5-15 минут вместо 1-2 минут локально), разрешение может быть ограничено до 720p, а при высокой нагрузке вы можете попасть в очередь ожидания.

Вариант 2: через ComfyUI (рекомендуется для большинства)

ComfyUI -- это популярная нода-редактор для AI-моделей с графическим интерфейсом. Вот пошаговая инструкция:

Зайдите на GitHub и найдите репозиторий «comfyanonymous/ComfyUI». Скачайте установщик для Windows или следуйте инструкции для macOS/Linux.
Запустите ComfyUI. По умолчанию он открывается в браузере по адресу localhost:8188.
Откройте Manager (меню «Manager» в правом верхнем углу), найдите расширение «ComfyUI-LTXVideo» и установите его. Перезапустите ComfyUI.
Скачайте веса LTX-2 с Hugging Face: найдите репозиторий «Lightricks/LTX-Video» и скачайте файл весов (около 27 ГБ). Поместите его в папку ComfyUI/models/checkpoints/.
В репозитории Lightricks на GitHub найдите раздел «workflows» и скачайте готовый workflow-файл для LTX-2.
Перетащите файл workflow в окно ComfyUI. Введите промпт и нажмите «Queue Prompt». Первое видео будет готово примерно за 1-3 минуты в зависимости от вашей видеокарты.

Вариант 3: через Python CLI (для разработчиков)

Если вы знакомы с Python и командной строкой, установите пакет напрямую:

pip install ltx-video
python -m ltx_video.generate --prompt "A golden retriever running on a beach" --output video.mp4 --resolution 1080p

Требования: Python 3.10+, CUDA 12.1+ (для NVIDIA GPU), или ROCm (для AMD GPU). На Mac с чипами Apple Silicon (M1/M2/M3/M4) модель работает через Metal Performance Shaders, хотя медленнее, чем на дискретных видеокартах. Для 4K-генерации нужна видеокарта с 24 ГБ видеопамяти (RTX 3090, RTX 4090 или аналоги).

Вариант 4: LTX Studio (веб-интерфейс от Lightricks)

Lightricks также предоставляет LTX Studio -- коммерческий веб-сервис поверх LTX-2 с удобным графическим интерфейсом, инструментами раскадровки и редактирования. Подойдёт тем, у кого нет мощного компьютера, но кто хочет использовать именно LTX-2 без сложной настройки. Регистрация через email или Google-аккаунт.

Первый запуск -- что попробовать

После установки начните с этих сценариев, чтобы понять возможности модели и сформировать своё мнение о её качестве:

Базовая генерация с текстового промпта: Напишите описание сцены на английском языке -- LTX-2 лучше всего понимает именно английский, хотя базовую поддержку русского разработчики добавили в версии 2.1. Попробуйте: «A golden retriever running on a sandy beach at sunset, waves crashing gently, seagulls calling in the distance, warm light». Через 1-3 минуты получите 5-10-секундный клип с синхронизированными звуками: шум волн, крики птиц, топот лап. Это сразу демонстрирует главное преимущество модели.

Image-to-video (оживление фотографии): Загрузите любое изображение (JPEG или PNG) и добавьте описание движения. Например, фото горного озера и промпт: «The water ripples gently, pine trees sway in the breeze, birds fly across the sky». Модель анимирует статичную картинку, сохраняя визуальный стиль оригинала. Особенно впечатляет результат с портретными снимками -- лицо остаётся узнаваемым, но появляется естественная мимика.

Эксперимент с управлением камерой: В промпте можно указывать тип движения камеры. Попробуйте фразы: «slow zoom in», «cinematic pan left», «aerial drone shot pulling back». Это открывает возможности, которые раньше требовали профессионального операторского оборудования или сложного монтажа в After Effects.

Тест синхронизации звука: Специально попросите сцену с чёткими звуковыми событиями: «A chef chopping vegetables on a wooden board, knife sounds rhythmic, kitchen ambience». Посмотрите, насколько точно удары ножа совпадают с движениями в кадре. Именно в таких тестах LTX-2 обходит большинство конкурентов.

Совет по промптам: Оптимальная длина промпта для LTX-2 -- 20-50 слов. Перечисляйте не только объекты в кадре, но и настроение, освещение, атмосферу и звуки. Чем подробнее описание, тем точнее результат. Промпт «sunset» даст случайный результат; промпт «dramatic sunset over a stormy ocean, orange and purple clouds, waves crashing loudly against black rocks» -- предсказуемый и высококачественный.

Ключевые фишки

Первая в мире нативная 4K-генерация с синхронным звуком: Главная инновация LTX-2 -- единая диффузионная архитектура для видео и аудио. Конкурирующие модели, как правило, обрабатывают видео и звук раздельно: сначала генерируется изображение, потом подбирается или синтезируется звук. LTX-2 создаёт оба потока одновременно, что обеспечивает точную синхронизацию до уровня отдельных кадров. Если в кадре хлопают в ладоши -- звук хлопка совпадает с движением рук с точностью в десятки миллисекунд.

Полностью открытые веса и код обучения: В отличие от Sora (OpenAI), Veo (Google), Kling (Kuaishou) и других флагманских генераторов видео, LTX-2 публикует не только веса модели, но и полный код обучения. Это означает несколько важных вещей: во-первых, любая компания или исследователь могут дообучить модель на своём наборе данных -- например, в корпоративном фирменном стиле. Во-вторых, сообщество уже создало десятки специализированных вариантов модели, оптимизированных под конкретные жанры: аниме, реализм, абстракция.

Скорость на потребительском железе: Lightricks уделила большое внимание оптимизации для доступного оборудования. На RTX 4070 (12 ГБ VRAM) видео 720p длиной 5 секунд генерируется за 60-90 секунд. На RTX 4090 (24 ГБ VRAM) то же видео готово за 15-25 секунд, а 4K-генерация занимает около 3-5 минут. Для сравнения: запуск аналогичных задач в облаке у коммерческих конкурентов стоит от 0.5 до 3 долларов за клип.

LTX Studio -- профессиональный редактор: Параллельно с открытой моделью Lightricks развивает LTX Studio -- полноценный веб-редактор. Там есть инструменты раскадровки (storyboard), управление отдельными сценами, редактирование промптов покадрово и экспорт в различные форматы. Бесплатный план позволяет попробовать всё, платные -- снимают ограничения на количество генераций и разрешение.

Активное сообщество и экосистема: Через два месяца после релиза репозиторий LTX-2 на GitHub набрал более 18 000 звёзд, а на Civitai (платформе для распространения AI-моделей) появились десятки дообученных вариантов. Это значит, что сообщество уже создало специализированные версии для аниме-стиля, реалистичных портретов, архитектурных визуализаций и других жанров -- и всё это бесплатно.

Постоянные обновления: Lightricks следует модели итеративного развития: за первые месяцы после релиза вышли версии 2.1 и 2.3, каждая из которых улучшала качество сложных сцен, поддержку языков и точность звуковой синхронизации. Все обновления доступны бесплатно на Hugging Face.

Цены и ограничения

Открытые веса -- абсолютно бесплатно: Сама модель LTX-2 распространяется под лицензией Apache 2.0. Это означает, что вы можете использовать её бесплатно для любых целей, включая коммерческое применение, без каких-либо лицензионных отчислений. Вы платите только за оборудование и электричество.

Hugging Face (облако): Базовый доступ к демо через Hugging Face Spaces бесплатен. Платная подписка Hugging Face Pro стоит около 9 долларов в месяц (на момент написания) и ускоряет обработку, даёт приоритет в очереди и доступ к более мощным GPU.

LTX Studio (коммерческий веб-сервис Lightricks): Бесплатный план включает ограниченное количество генераций в месяц (конкретные цифры могут меняться -- проверяйте актуальные условия на сайте ltxstudio.com). Платные тарифы начинаются примерно от 20 долларов в месяц (на момент написания) и предоставляют неограниченные генерации в пределах установленного пула вычислительных мощностей, более высокое разрешение и приоритетную обработку.

Ограничения, которые стоит знать:

Длина клипа: Одна генерация ограничена 10 секундами. Для длинных роликов нужно объединять несколько клипов вручную -- в LTX Studio есть инструменты для этого.
Требования к железу для 4K: 4K-генерация требует видеокарту с 24+ ГБ видеопамяти. На 12-16 ГБ доступно разрешение 720p-1080p.
Язык промптов: Лучшие результаты -- с промптами на английском. Русский поддерживается базово начиная с версии 2.1, но качество следования промпту заметно ниже.
Размер модели: Полные веса занимают около 27 ГБ на диске. Убедитесь, что у вас достаточно свободного места.
Ограничения безопасности: Модель отклоняет запросы на генерацию реалистичного насилия, откровенного контента и дипфейков узнаваемых личностей.

Нужен ли VPN из России

Для скачивания весов модели с Hugging Face и кода с GitHub VPN не требуется -- оба сервиса доступны из России без ограничений на момент написания этого материала.

LTX Studio (веб-сервис Lightricks) также официально не заблокирован в России. Однако для оплаты платной подписки потребуется иностранная карта: российские Visa и Mastercard не работают для зарубежных платежей с 2022 года. Альтернативы: карта зарубежного банка, UnionPay, или оплата через криптовалюту, если сервис её принимает.

При полностью локальном запуске через ComfyUI или Python CLI вопрос VPN и платёжных систем не возникает вообще. После однократного скачивания весов модель работает офлайн, без подключения к интернету.

Если вы пользуетесь Hugging Face Spaces для облачного тестирования и замечаете, что подключение нестабильно -- VPN с выходом через европейский или американский сервер обычно решает проблему.

LTX-2.3: текущая версия (5 марта 2026)

5 марта 2026 года Lightricks выпустила LTX-2.3 -- значительное обновление, которое является текущей стабильной версией модели. Ключевые характеристики LTX-2.3:

22 миллиарда параметров -- значительный рост по сравнению с предыдущими версиями
Переработанный VAE (Variational Autoencoder) -- улучшенное сжатие и качество видео на выходе
Текстовый коннектор в 4 раза больше -- модель точнее следует текстовым инструкциям
Нативный формат 9:16 -- вертикальные видео для мобильных платформ без обрезки
LoRA поддержка -- возможность дообучения модели на собственных данных для стилизации
4K при 50fps -- максимальное качество для профессионального использования
Клипы до 20 секунд -- вдвое длиннее, чем у предыдущей версии

LTX Desktop NLE Editor: Параллельно с LTX-2.3 Lightricks запустила LTX Desktop -- настольный редактор (NLE, Non-Linear Editor) с AI-функциями. В отличие от веб-сервисов, LTX Desktop работает локально на вашем компьютере, не требует подключения к интернету для генерации и предоставляет полноценный монтажный инструментарий. Редактор предназначен для профессионалов, которым нужен контроль над всем производственным процессом без облачных зависимостей.

Unified LTX Trainer (17 июня 2026): Lightricks выпустила Unified LTX Trainer -- единый инструмент тонкой настройки для LTX-2. Главная идея: 13 целей обучения (training objectives) -- LoRA, IC-LoRA и другие -- объединены в единый YAML-конфигурационный файл. Раньше каждый режим fine-tuning требовал отдельного пайплайна и конфигурации; теперь достаточно одного YAML-файла, чтобы переключиться между режимами или комбинировать их. Минимальные требования к VRAM: от 12 GB для базовых режимов (LoRA на 720p) до 24 GB для полного fine-tuning. Это существенно снижает порог входа для специалистов, которые хотят обучать кастомизированные версии модели под конкретный стиль, бренд или персонажей.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:LTX-2 Lightricks генератор видео open source ComfyUI локальный AI

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Как начать пользоваться Agno: Python-фреймворк для создания AI-агентов

Agno (бывший phidata) - один из самых популярных Python-фреймворков для построения AI-агентов с 39k+ звезд на GitHub. Пошаговый гайд: установка, первый агент за 5 минут, мультиагентные команды и деплой в продакшн.

2026-07-14·8 мин

С чего начать·Гайд

Seedance 2.5: как начать пользоваться генератором видео от ByteDance

Seedance 2.5 от ByteDance генерирует нативное 30-секундное видео в один проход, принимает до 50 мультимодальных референсов и позволяет редактировать отдельные фрагменты без перегенерации всего клипа.

2026-07-13·7 мин

С чего начать·Гайд

ChatGPT Work: как начать пользоваться агентным рабочим столом OpenAI

9 июля 2026 OpenAI запустила ChatGPT Work -- агента, который берёт у вас целый проект, сам планирует шаги, работает часами в фоне и возвращает готовый документ, таблицу или презентацию.

2026-07-13·8 мин