Meituan открыла код LongCat-Video-Avatar 1.5 — фотореалистичный цифровой человек из аудио

Китайский Meituan выложил в open source модель LongCat-Video-Avatar 1.5: по одному аудиофайлу она генерирует видео говорящего человека с сохранением мимики и идентичности. Прямой удар по HeyGen и Kling Avatar.

Aravana··1 мин

🔴 Meituan открыла код LongCat-Video-Avatar 1.5 — фотореалистичный цифровой человек из аудио

Компания, которую в России знают как «китайский Delivery Club», только что выпустила то, на чём построены бизнесы за миллиарды долларов. И сделала это бесплатно. Meituan открыла код LongCat-Video-Avatar 1.5 — модели, которая по одному аудиофайлу генерирует видео фотореалистичного человека, говорящего этот текст с сохранением мимики, движений и идентичности.

Что внутри. Модель использует обновлённый аудио-кодер Whisper-Large и работает в 8 шагов вывода вместо десятков. Улучшена синхронизация губ и мимики, добавлены поддержка длинных видео и стилизации под аниме или животных. По бенчмаркам на 508 парах аудио-изображение и оценках 770 экспертов модель обходит коммерческие HeyGen и Kling Avatar 2.0. Лицензия — MIT, релиз состоялся 22 мая 2026 года, код выложен в открытый доступ для академического использования.

Для российского предпринимателя это прямой сигнал. Рынок цифровых аватаров, где коммерческие игроки берут деньги за каждую минуту синтетического видео, теперь подмят китайским open-source решением. Стоимость съёмки говорящего ролика стремительно падает к нулю. Если у вас обучающие видео, продуктовые объяснения или маркетинг на разных языках, пересмотрите смету: вам не нужны ни студия, ни актёры. Нужен микрофон и фотография.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #мультимодальность #Meituan #Китай #инвестиции #будущеетруда #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Alipay открыл кошелёк для AI-агентов — они теперь могут покупать сами

Ant Group выкатил AI Wallet и Token Pay — первую крупную платёжную инфраструктуру под автономных агентов, которые делают покупки за пользователя.

·1 мин

Microsoft научила свет считать AI — и обогнала GPU в 100 раз по эффективности

Аналоговый оптический компьютер от Microsoft и Barclays считает на лучах света — энергоэффективность выше GPU в сто с лишним раз. Работа опубликована в Nature.

·1 мин

Китай выкатил свою ОС для гуманоидов — альтернатива ROS уже на подходе

Shenzhen Kaihong показала M-Robots OS 2.0 — нативную ОС для роботов на базе OpenHarmony. Цель — заменить американский ROS на китайском рынке.

·1 мин