LTX-2: как начать пользоваться открытым генератором видео от Lightricks

LTX-2 -- первая в мире open-source модель с генерацией 4K-видео и синхронного звука в одном проходе. Занимает 2-е место на Arena ELO. Полный гайд по установке и первому запуску.

·8 мин

Что это и для кого

LTX-2 -- это открытая (open-source) модель генерации видео от израильской компании Lightricks, создателей популярных мобильных приложений для редактирования фото и видео. Официальный релиз состоялся 6 января 2026 года, и с первых же дней модель попала в топ мировых рейтингов: на платформе LM Arena она занимает 2-е место среди всех генераторов видео с Elo-рейтингом 1930, уступая только Kling V3.

Главная особенность LTX-2, которая выделяет её на фоне конкурентов: это первая производственно-готовая модель, которая генерирует 4K-видео и синхронизированный звук в одном проходе -- без промежуточных этапов, без отдельного шага для аудио. До LTX-2 создателям контента приходилось либо добавлять звук вручную в видеоредакторе, либо пользоваться закрытыми коммерческими сервисами вроде Google Veo 3. Оба подхода требовали времени, навыков или денег.

Модель полностью открыта: опубликованы веса, архитектура и обучающий код под лицензией Apache 2.0. Это значит, что вы можете запустить её локально на своём компьютере, дообучить на собственных данных или встроить в коммерческие продукты без каких-либо лицензионных отчислений. Для базового запуска достаточно видеокарты с 12 ГБ видеопамяти, например RTX 3080 или RTX 4070.

Кому подойдёт LTX-2:

  • Создателям контента, которые хотят бесплатно генерировать видеоролики с музыкой и звуками для YouTube, TikTok или Instagram.
  • Разработчикам, которым нужна локальная модель для встраивания в SaaS-продукты или автоматизации видеопроизводства.
  • Видеографам и аниматорам, которые ищут альтернативу дорогим коммерческим сервисам и хотят сохранять полный контроль над результатом.
  • Исследователям, которые изучают диффузионные модели и хотят дообучать LTX-2 на специализированных данных.
  • Всем, кто заботится о приватности: при локальном запуске ни одна ваша видеозаготовка не покидает ваш компьютер.

Важный контекст: LTX-2 вышла в период, когда рынок AI-видео бурно растёт. Закрытые решения -- Kling, Runway, Sora -- требуют подписки и отправляют данные на серверы компании. LTX-2 меняет уравнение, давая сопоставимое качество бесплатно и локально.

Как зарегистрироваться / установить

Так как LTX-2 -- это открытая модель, «регистрация» здесь означает выбор способа запуска. Есть три основных варианта: облачный тест через Hugging Face, локальный запуск через ComfyUI (рекомендуется для большинства пользователей) и установка через Python CLI для разработчиков.

Вариант 1: через Hugging Face Spaces (облачный тест, бесплатно)

Самый простой способ попробовать модель без каких-либо установок. Откройте сайт huggingface.co, зарегистрируйтесь (достаточно email-адреса), затем найдите пространство «LTX-2 Lightricks» через поисковую строку на сайте. Нажмите кнопку запуска и введите текстовый промпт. Демо запустит генерацию прямо в браузере. Ограничения: облачный запуск медленнее (5-15 минут вместо 1-2 минут локально), разрешение может быть ограничено до 720p, а при высокой нагрузке вы можете попасть в очередь ожидания.

Вариант 2: через ComfyUI (рекомендуется для большинства)

ComfyUI -- это популярная нода-редактор для AI-моделей с графическим интерфейсом. Вот пошаговая инструкция:

  1. Зайдите на GitHub и найдите репозиторий «comfyanonymous/ComfyUI». Скачайте установщик для Windows или следуйте инструкции для macOS/Linux.
  2. Запустите ComfyUI. По умолчанию он открывается в браузере по адресу localhost:8188.
  3. Откройте Manager (меню «Manager» в правом верхнем углу), найдите расширение «ComfyUI-LTXVideo» и установите его. Перезапустите ComfyUI.
  4. Скачайте веса LTX-2 с Hugging Face: найдите репозиторий «Lightricks/LTX-Video» и скачайте файл весов (около 27 ГБ). Поместите его в папку ComfyUI/models/checkpoints/.
  5. В репозитории Lightricks на GitHub найдите раздел «workflows» и скачайте готовый workflow-файл для LTX-2.
  6. Перетащите файл workflow в окно ComfyUI. Введите промпт и нажмите «Queue Prompt». Первое видео будет готово примерно за 1-3 минуты в зависимости от вашей видеокарты.

Вариант 3: через Python CLI (для разработчиков)

Если вы знакомы с Python и командной строкой, установите пакет напрямую:

pip install ltx-video
python -m ltx_video.generate --prompt "A golden retriever running on a beach" --output video.mp4 --resolution 1080p

Требования: Python 3.10+, CUDA 12.1+ (для NVIDIA GPU), или ROCm (для AMD GPU). На Mac с чипами Apple Silicon (M1/M2/M3/M4) модель работает через Metal Performance Shaders, хотя медленнее, чем на дискретных видеокартах. Для 4K-генерации нужна видеокарта с 24 ГБ видеопамяти (RTX 3090, RTX 4090 или аналоги).

Вариант 4: LTX Studio (веб-интерфейс от Lightricks)

Lightricks также предоставляет LTX Studio -- коммерческий веб-сервис поверх LTX-2 с удобным графическим интерфейсом, инструментами раскадровки и редактирования. Подойдёт тем, у кого нет мощного компьютера, но кто хочет использовать именно LTX-2 без сложной настройки. Регистрация через email или Google-аккаунт.

Первый запуск -- что попробовать

После установки начните с этих сценариев, чтобы понять возможности модели и сформировать своё мнение о её качестве:

Базовая генерация с текстового промпта: Напишите описание сцены на английском языке -- LTX-2 лучше всего понимает именно английский, хотя базовую поддержку русского разработчики добавили в версии 2.1. Попробуйте: «A golden retriever running on a sandy beach at sunset, waves crashing gently, seagulls calling in the distance, warm light». Через 1-3 минуты получите 5-10-секундный клип с синхронизированными звуками: шум волн, крики птиц, топот лап. Это сразу демонстрирует главное преимущество модели.

Image-to-video (оживление фотографии): Загрузите любое изображение (JPEG или PNG) и добавьте описание движения. Например, фото горного озера и промпт: «The water ripples gently, pine trees sway in the breeze, birds fly across the sky». Модель анимирует статичную картинку, сохраняя визуальный стиль оригинала. Особенно впечатляет результат с портретными снимками -- лицо остаётся узнаваемым, но появляется естественная мимика.

Эксперимент с управлением камерой: В промпте можно указывать тип движения камеры. Попробуйте фразы: «slow zoom in», «cinematic pan left», «aerial drone shot pulling back». Это открывает возможности, которые раньше требовали профессионального операторского оборудования или сложного монтажа в After Effects.

Тест синхронизации звука: Специально попросите сцену с чёткими звуковыми событиями: «A chef chopping vegetables on a wooden board, knife sounds rhythmic, kitchen ambience». Посмотрите, насколько точно удары ножа совпадают с движениями в кадре. Именно в таких тестах LTX-2 обходит большинство конкурентов.

Совет по промптам: Оптимальная длина промпта для LTX-2 -- 20-50 слов. Перечисляйте не только объекты в кадре, но и настроение, освещение, атмосферу и звуки. Чем подробнее описание, тем точнее результат. Промпт «sunset» даст случайный результат; промпт «dramatic sunset over a stormy ocean, orange and purple clouds, waves crashing loudly against black rocks» -- предсказуемый и высококачественный.

Ключевые фишки

Первая в мире нативная 4K-генерация с синхронным звуком: Главная инновация LTX-2 -- единая диффузионная архитектура для видео и аудио. Конкурирующие модели, как правило, обрабатывают видео и звук раздельно: сначала генерируется изображение, потом подбирается или синтезируется звук. LTX-2 создаёт оба потока одновременно, что обеспечивает точную синхронизацию до уровня отдельных кадров. Если в кадре хлопают в ладоши -- звук хлопка совпадает с движением рук с точностью в десятки миллисекунд.

Полностью открытые веса и код обучения: В отличие от Sora (OpenAI), Veo (Google), Kling (Kuaishou) и других флагманских генераторов видео, LTX-2 публикует не только веса модели, но и полный код обучения. Это означает несколько важных вещей: во-первых, любая компания или исследователь могут дообучить модель на своём наборе данных -- например, в корпоративном фирменном стиле. Во-вторых, сообщество уже создало десятки специализированных вариантов модели, оптимизированных под конкретные жанры: аниме, реализм, абстракция.

Скорость на потребительском железе: Lightricks уделила большое внимание оптимизации для доступного оборудования. На RTX 4070 (12 ГБ VRAM) видео 720p длиной 5 секунд генерируется за 60-90 секунд. На RTX 4090 (24 ГБ VRAM) то же видео готово за 15-25 секунд, а 4K-генерация занимает около 3-5 минут. Для сравнения: запуск аналогичных задач в облаке у коммерческих конкурентов стоит от 0.5 до 3 долларов за клип.

LTX Studio -- профессиональный редактор: Параллельно с открытой моделью Lightricks развивает LTX Studio -- полноценный веб-редактор. Там есть инструменты раскадровки (storyboard), управление отдельными сценами, редактирование промптов покадрово и экспорт в различные форматы. Бесплатный план позволяет попробовать всё, платные -- снимают ограничения на количество генераций и разрешение.

Активное сообщество и экосистема: Через два месяца после релиза репозиторий LTX-2 на GitHub набрал более 18 000 звёзд, а на Civitai (платформе для распространения AI-моделей) появились десятки дообученных вариантов. Это значит, что сообщество уже создало специализированные версии для аниме-стиля, реалистичных портретов, архитектурных визуализаций и других жанров -- и всё это бесплатно.

Постоянные обновления: Lightricks следует модели итеративного развития: за первые месяцы после релиза вышли версии 2.1 и 2.3, каждая из которых улучшала качество сложных сцен, поддержку языков и точность звуковой синхронизации. Все обновления доступны бесплатно на Hugging Face.

Цены и ограничения

Открытые веса -- абсолютно бесплатно: Сама модель LTX-2 распространяется под лицензией Apache 2.0. Это означает, что вы можете использовать её бесплатно для любых целей, включая коммерческое применение, без каких-либо лицензионных отчислений. Вы платите только за оборудование и электричество.

Hugging Face (облако): Базовый доступ к демо через Hugging Face Spaces бесплатен. Платная подписка Hugging Face Pro стоит около 9 долларов в месяц (на момент написания) и ускоряет обработку, даёт приоритет в очереди и доступ к более мощным GPU.

LTX Studio (коммерческий веб-сервис Lightricks): Бесплатный план включает ограниченное количество генераций в месяц (конкретные цифры могут меняться -- проверяйте актуальные условия на сайте ltxstudio.com). Платные тарифы начинаются примерно от 20 долларов в месяц (на момент написания) и предоставляют неограниченные генерации в пределах установленного пула вычислительных мощностей, более высокое разрешение и приоритетную обработку.

Ограничения, которые стоит знать:

  • Длина клипа: Одна генерация ограничена 10 секундами. Для длинных роликов нужно объединять несколько клипов вручную -- в LTX Studio есть инструменты для этого.
  • Требования к железу для 4K: 4K-генерация требует видеокарту с 24+ ГБ видеопамяти. На 12-16 ГБ доступно разрешение 720p-1080p.
  • Язык промптов: Лучшие результаты -- с промптами на английском. Русский поддерживается базово начиная с версии 2.1, но качество следования промпту заметно ниже.
  • Размер модели: Полные веса занимают около 27 ГБ на диске. Убедитесь, что у вас достаточно свободного места.
  • Ограничения безопасности: Модель отклоняет запросы на генерацию реалистичного насилия, откровенного контента и дипфейков узнаваемых личностей.

Нужен ли VPN из России

Для скачивания весов модели с Hugging Face и кода с GitHub VPN не требуется -- оба сервиса доступны из России без ограничений на момент написания этого материала.

LTX Studio (веб-сервис Lightricks) также официально не заблокирован в России. Однако для оплаты платной подписки потребуется иностранная карта: российские Visa и Mastercard не работают для зарубежных платежей с 2022 года. Альтернативы: карта зарубежного банка, UnionPay, или оплата через криптовалюту, если сервис её принимает.

При полностью локальном запуске через ComfyUI или Python CLI вопрос VPN и платёжных систем не возникает вообще. После однократного скачивания весов модель работает офлайн, без подключения к интернету.

Если вы пользуетесь Hugging Face Spaces для облачного тестирования и замечаете, что подключение нестабильно -- VPN с выходом через европейский или американский сервер обычно решает проблему.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Jasper AI: как начать пользоваться AI-платформой для маркетинга и контента

Jasper AI -- лидирующая платформа для создания маркетингового контента с AI. Более 500 000 пользователей, уникальная функция Brand Voice и автоматизация рекламных кампаний. Полный гайд по регистрации и первым шагам.

·8 мин

Superhuman: как начать пользоваться самым быстрым AI email-клиентом

Superhuman -- AI-клиент для Gmail и Outlook, который помогает обрабатывать почту в разы быстрее. Auto Drafts, умные ярлыки, интеграция с CRM. Полный гайд по регистрации и настройке.

·7 мин

Emergent Wingman: как начать пользоваться AI-агентом внутри WhatsApp и Telegram

Emergent Wingman -- автономный AI-агент, который живёт прямо в вашем мессенджере. Рассказываем, как подключить его, какие задачи он решает и сколько стоит.

·8 мин