Meituan открыла код LongCat-Video-Avatar 1.5 — фотореалистичный цифровой человек из аудио

Китайский Meituan выложил в open source модель LongCat-Video-Avatar 1.5: по одному аудиофайлу она генерирует видео говорящего человека с сохранением мимики и идентичности. Прямой удар по HeyGen и Kling Avatar.

Aravana·2026-05-27·1 мин

🔴 Meituan открыла код LongCat-Video-Avatar 1.5 — фотореалистичный цифровой человек из аудио

Компания, которую в России знают как «китайский Delivery Club», только что выпустила то, на чём построены бизнесы за миллиарды долларов. И сделала это бесплатно. Meituan открыла код LongCat-Video-Avatar 1.5 — модели, которая по одному аудиофайлу генерирует видео фотореалистичного человека, говорящего этот текст с сохранением мимики, движений и идентичности.

Что внутри. Модель использует обновлённый аудио-кодер Whisper-Large и работает в 8 шагов вывода вместо десятков. Улучшена синхронизация губ и мимики, добавлены поддержка длинных видео и стилизации под аниме или животных. По бенчмаркам на 508 парах аудио-изображение и оценках 770 экспертов модель обходит коммерческие HeyGen и Kling Avatar 2.0. Лицензия — MIT, релиз состоялся 22 мая 2026 года, код выложен в открытый доступ для академического использования.

Для российского предпринимателя это прямой сигнал. Рынок цифровых аватаров, где коммерческие игроки берут деньги за каждую минуту синтетического видео, теперь подмят китайским open-source решением. Стоимость съёмки говорящего ролика стремительно падает к нулю. Если у вас обучающие видео, продуктовые объяснения или маркетинг на разных языках, пересмотрите смету: вам не нужны ни студия, ни актёры. Нужен микрофон и фотография.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #мультимодальность #Meituan #Китай #инвестиции #будущеетруда #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:Telegram X LinkedIn

Как вам материал?

Китайский разносчик еды собрал ИИ-гиганта, и ни одного чипа Nvidia

Китайский сервис доставки еды выпустил крупнейшую открытую модель в мире — и обучил её на собственных китайских ускорителях, полностью в обход санкций на Nvidia.

2026-07-08·1 мин

AI·Срочное

OpenAI выкатил GPT-5.6, но пользоваться пока нельзя

OpenAI представила тройку моделей GPT-5.6 — Sol, Terra и Luna. Доступ временно ограничен по требованию правительства США.

2026-06-29·1 мин

AI·Срочное

OpenAI впервые приехала продавать рекламу и принесла рынку конкретные цифры

OpenAI на Cannes Lions 2026 раскрыла метрики ChatGPT-рекламы: 2 000+ брендов, семь стран, 20% запросов с коммерческим интентом, доля закрытий упала на 50%.

2026-06-29·1 мин