LTX-2: как начать пользоваться открытым генератором видео от Lightricks
LTX-2 -- первая в мире open-source модель с генерацией 4K-видео и синхронного звука в одном проходе. Занимает 2-е место на Arena ELO. Полный гайд по установке и первому запуску.
Что это и для кого
LTX-2 -- это открытая (open-source) модель генерации видео от израильской компании Lightricks, создателей популярных мобильных приложений для редактирования фото и видео. Официальный релиз состоялся 6 января 2026 года, и с первых же дней модель попала в топ мировых рейтингов: на платформе LM Arena она занимает 2-е место среди всех генераторов видео с Elo-рейтингом 1930, уступая только Kling V3.
Главная особенность LTX-2, которая выделяет её на фоне конкурентов: это первая производственно-готовая модель, которая генерирует 4K-видео и синхронизированный звук в одном проходе -- без промежуточных этапов, без отдельного шага для аудио. До LTX-2 создателям контента приходилось либо добавлять звук вручную в видеоредакторе, либо пользоваться закрытыми коммерческими сервисами вроде Google Veo 3. Оба подхода требовали времени, навыков или денег.
Модель полностью открыта: опубликованы веса, архитектура и обучающий код под лицензией Apache 2.0. Это значит, что вы можете запустить её локально на своём компьютере, дообучить на собственных данных или встроить в коммерческие продукты без каких-либо лицензионных отчислений. Для базового запуска достаточно видеокарты с 12 ГБ видеопамяти, например RTX 3080 или RTX 4070.
Кому подойдёт LTX-2:
- Создателям контента, которые хотят бесплатно генерировать видеоролики с музыкой и звуками для YouTube, TikTok или Instagram.
- Разработчикам, которым нужна локальная модель для встраивания в SaaS-продукты или автоматизации видеопроизводства.
- Видеографам и аниматорам, которые ищут альтернативу дорогим коммерческим сервисам и хотят сохранять полный контроль над результатом.
- Исследователям, которые изучают диффузионные модели и хотят дообучать LTX-2 на специализированных данных.
- Всем, кто заботится о приватности: при локальном запуске ни одна ваша видеозаготовка не покидает ваш компьютер.
Важный контекст: LTX-2 вышла в период, когда рынок AI-видео бурно растёт. Закрытые решения -- Kling, Runway, Sora -- требуют подписки и отправляют данные на серверы компании. LTX-2 меняет уравнение, давая сопоставимое качество бесплатно и локально.
Как зарегистрироваться / установить
Так как LTX-2 -- это открытая модель, «регистрация» здесь означает выбор способа запуска. Есть три основных варианта: облачный тест через Hugging Face, локальный запуск через ComfyUI (рекомендуется для большинства пользователей) и установка через Python CLI для разработчиков.
Вариант 1: через Hugging Face Spaces (облачный тест, бесплатно)
Самый простой способ попробовать модель без каких-либо установок. Откройте сайт huggingface.co, зарегистрируйтесь (достаточно email-адреса), затем найдите пространство «LTX-2 Lightricks» через поисковую строку на сайте. Нажмите кнопку запуска и введите текстовый промпт. Демо запустит генерацию прямо в браузере. Ограничения: облачный запуск медленнее (5-15 минут вместо 1-2 минут локально), разрешение может быть ограничено до 720p, а при высокой нагрузке вы можете попасть в очередь ожидания.
Вариант 2: через ComfyUI (рекомендуется для большинства)
ComfyUI -- это популярная нода-редактор для AI-моделей с графическим интерфейсом. Вот пошаговая инструкция:
- Зайдите на GitHub и найдите репозиторий «comfyanonymous/ComfyUI». Скачайте установщик для Windows или следуйте инструкции для macOS/Linux.
- Запустите ComfyUI. По умолчанию он открывается в браузере по адресу localhost:8188.
- Откройте Manager (меню «Manager» в правом верхнем углу), найдите расширение «ComfyUI-LTXVideo» и установите его. Перезапустите ComfyUI.
- Скачайте веса LTX-2 с Hugging Face: найдите репозиторий «Lightricks/LTX-Video» и скачайте файл весов (около 27 ГБ). Поместите его в папку ComfyUI/models/checkpoints/.
- В репозитории Lightricks на GitHub найдите раздел «workflows» и скачайте готовый workflow-файл для LTX-2.
- Перетащите файл workflow в окно ComfyUI. Введите промпт и нажмите «Queue Prompt». Первое видео будет готово примерно за 1-3 минуты в зависимости от вашей видеокарты.
Вариант 3: через Python CLI (для разработчиков)
Если вы знакомы с Python и командной строкой, установите пакет напрямую:
pip install ltx-video
python -m ltx_video.generate --prompt "A golden retriever running on a beach" --output video.mp4 --resolution 1080pТребования: Python 3.10+, CUDA 12.1+ (для NVIDIA GPU), или ROCm (для AMD GPU). На Mac с чипами Apple Silicon (M1/M2/M3/M4) модель работает через Metal Performance Shaders, хотя медленнее, чем на дискретных видеокартах. Для 4K-генерации нужна видеокарта с 24 ГБ видеопамяти (RTX 3090, RTX 4090 или аналоги).
Вариант 4: LTX Studio (веб-интерфейс от Lightricks)
Lightricks также предоставляет LTX Studio -- коммерческий веб-сервис поверх LTX-2 с удобным графическим интерфейсом, инструментами раскадровки и редактирования. Подойдёт тем, у кого нет мощного компьютера, но кто хочет использовать именно LTX-2 без сложной настройки. Регистрация через email или Google-аккаунт.
Первый запуск -- что попробовать
После установки начните с этих сценариев, чтобы понять возможности модели и сформировать своё мнение о её качестве:
Базовая генерация с текстового промпта: Напишите описание сцены на английском языке -- LTX-2 лучше всего понимает именно английский, хотя базовую поддержку русского разработчики добавили в версии 2.1. Попробуйте: «A golden retriever running on a sandy beach at sunset, waves crashing gently, seagulls calling in the distance, warm light». Через 1-3 минуты получите 5-10-секундный клип с синхронизированными звуками: шум волн, крики птиц, топот лап. Это сразу демонстрирует главное преимущество модели.
Image-to-video (оживление фотографии): Загрузите любое изображение (JPEG или PNG) и добавьте описание движения. Например, фото горного озера и промпт: «The water ripples gently, pine trees sway in the breeze, birds fly across the sky». Модель анимирует статичную картинку, сохраняя визуальный стиль оригинала. Особенно впечатляет результат с портретными снимками -- лицо остаётся узнаваемым, но появляется естественная мимика.
Эксперимент с управлением камерой: В промпте можно указывать тип движения камеры. Попробуйте фразы: «slow zoom in», «cinematic pan left», «aerial drone shot pulling back». Это открывает возможности, которые раньше требовали профессионального операторского оборудования или сложного монтажа в After Effects.
Тест синхронизации звука: Специально попросите сцену с чёткими звуковыми событиями: «A chef chopping vegetables on a wooden board, knife sounds rhythmic, kitchen ambience». Посмотрите, насколько точно удары ножа совпадают с движениями в кадре. Именно в таких тестах LTX-2 обходит большинство конкурентов.
Совет по промптам: Оптимальная длина промпта для LTX-2 -- 20-50 слов. Перечисляйте не только объекты в кадре, но и настроение, освещение, атмосферу и звуки. Чем подробнее описание, тем точнее результат. Промпт «sunset» даст случайный результат; промпт «dramatic sunset over a stormy ocean, orange and purple clouds, waves crashing loudly against black rocks» -- предсказуемый и высококачественный.
Ключевые фишки
Первая в мире нативная 4K-генерация с синхронным звуком: Главная инновация LTX-2 -- единая диффузионная архитектура для видео и аудио. Конкурирующие модели, как правило, обрабатывают видео и звук раздельно: сначала генерируется изображение, потом подбирается или синтезируется звук. LTX-2 создаёт оба потока одновременно, что обеспечивает точную синхронизацию до уровня отдельных кадров. Если в кадре хлопают в ладоши -- звук хлопка совпадает с движением рук с точностью в десятки миллисекунд.
Полностью открытые веса и код обучения: В отличие от Sora (OpenAI), Veo (Google), Kling (Kuaishou) и других флагманских генераторов видео, LTX-2 публикует не только веса модели, но и полный код обучения. Это означает несколько важных вещей: во-первых, любая компания или исследователь могут дообучить модель на своём наборе данных -- например, в корпоративном фирменном стиле. Во-вторых, сообщество уже создало десятки специализированных вариантов модели, оптимизированных под конкретные жанры: аниме, реализм, абстракция.
Скорость на потребительском железе: Lightricks уделила большое внимание оптимизации для доступного оборудования. На RTX 4070 (12 ГБ VRAM) видео 720p длиной 5 секунд генерируется за 60-90 секунд. На RTX 4090 (24 ГБ VRAM) то же видео готово за 15-25 секунд, а 4K-генерация занимает около 3-5 минут. Для сравнения: запуск аналогичных задач в облаке у коммерческих конкурентов стоит от 0.5 до 3 долларов за клип.
LTX Studio -- профессиональный редактор: Параллельно с открытой моделью Lightricks развивает LTX Studio -- полноценный веб-редактор. Там есть инструменты раскадровки (storyboard), управление отдельными сценами, редактирование промптов покадрово и экспорт в различные форматы. Бесплатный план позволяет попробовать всё, платные -- снимают ограничения на количество генераций и разрешение.
Активное сообщество и экосистема: Через два месяца после релиза репозиторий LTX-2 на GitHub набрал более 18 000 звёзд, а на Civitai (платформе для распространения AI-моделей) появились десятки дообученных вариантов. Это значит, что сообщество уже создало специализированные версии для аниме-стиля, реалистичных портретов, архитектурных визуализаций и других жанров -- и всё это бесплатно.
Постоянные обновления: Lightricks следует модели итеративного развития: за первые месяцы после релиза вышли версии 2.1 и 2.3, каждая из которых улучшала качество сложных сцен, поддержку языков и точность звуковой синхронизации. Все обновления доступны бесплатно на Hugging Face.
Цены и ограничения
Открытые веса -- абсолютно бесплатно: Сама модель LTX-2 распространяется под лицензией Apache 2.0. Это означает, что вы можете использовать её бесплатно для любых целей, включая коммерческое применение, без каких-либо лицензионных отчислений. Вы платите только за оборудование и электричество.
Hugging Face (облако): Базовый доступ к демо через Hugging Face Spaces бесплатен. Платная подписка Hugging Face Pro стоит около 9 долларов в месяц (на момент написания) и ускоряет обработку, даёт приоритет в очереди и доступ к более мощным GPU.
LTX Studio (коммерческий веб-сервис Lightricks): Бесплатный план включает ограниченное количество генераций в месяц (конкретные цифры могут меняться -- проверяйте актуальные условия на сайте ltxstudio.com). Платные тарифы начинаются примерно от 20 долларов в месяц (на момент написания) и предоставляют неограниченные генерации в пределах установленного пула вычислительных мощностей, более высокое разрешение и приоритетную обработку.
Ограничения, которые стоит знать:
- Длина клипа: Одна генерация ограничена 10 секундами. Для длинных роликов нужно объединять несколько клипов вручную -- в LTX Studio есть инструменты для этого.
- Требования к железу для 4K: 4K-генерация требует видеокарту с 24+ ГБ видеопамяти. На 12-16 ГБ доступно разрешение 720p-1080p.
- Язык промптов: Лучшие результаты -- с промптами на английском. Русский поддерживается базово начиная с версии 2.1, но качество следования промпту заметно ниже.
- Размер модели: Полные веса занимают около 27 ГБ на диске. Убедитесь, что у вас достаточно свободного места.
- Ограничения безопасности: Модель отклоняет запросы на генерацию реалистичного насилия, откровенного контента и дипфейков узнаваемых личностей.
Нужен ли VPN из России
Для скачивания весов модели с Hugging Face и кода с GitHub VPN не требуется -- оба сервиса доступны из России без ограничений на момент написания этого материала.
LTX Studio (веб-сервис Lightricks) также официально не заблокирован в России. Однако для оплаты платной подписки потребуется иностранная карта: российские Visa и Mastercard не работают для зарубежных платежей с 2022 года. Альтернативы: карта зарубежного банка, UnionPay, или оплата через криптовалюту, если сервис её принимает.
При полностью локальном запуске через ComfyUI или Python CLI вопрос VPN и платёжных систем не возникает вообще. После однократного скачивания весов модель работает офлайн, без подключения к интернету.
Если вы пользуетесь Hugging Face Spaces для облачного тестирования и замечаете, что подключение нестабильно -- VPN с выходом через европейский или американский сервер обычно решает проблему.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Jasper AI: как начать пользоваться AI-платформой для маркетинга и контента
Jasper AI -- лидирующая платформа для создания маркетингового контента с AI. Более 500 000 пользователей, уникальная функция Brand Voice и автоматизация рекламных кампаний. Полный гайд по регистрации и первым шагам.
Superhuman: как начать пользоваться самым быстрым AI email-клиентом
Superhuman -- AI-клиент для Gmail и Outlook, который помогает обрабатывать почту в разы быстрее. Auto Drafts, умные ярлыки, интеграция с CRM. Полный гайд по регистрации и настройке.
Emergent Wingman: как начать пользоваться AI-агентом внутри WhatsApp и Telegram
Emergent Wingman -- автономный AI-агент, который живёт прямо в вашем мессенджере. Рассказываем, как подключить его, какие задачи он решает и сколько стоит.