Meituan открыла код LongCat-Video-Avatar 1.5 — фотореалистичный цифровой человек из аудио
Китайский Meituan выложил в open source модель LongCat-Video-Avatar 1.5: по одному аудиофайлу она генерирует видео говорящего человека с сохранением мимики и идентичности. Прямой удар по HeyGen и Kling Avatar.
🔴 Meituan открыла код LongCat-Video-Avatar 1.5 — фотореалистичный цифровой человек из аудио
Компания, которую в России знают как «китайский Delivery Club», только что выпустила то, на чём построены бизнесы за миллиарды долларов. И сделала это бесплатно. Meituan открыла код LongCat-Video-Avatar 1.5 — модели, которая по одному аудиофайлу генерирует видео фотореалистичного человека, говорящего этот текст с сохранением мимики, движений и идентичности.
Что внутри. Модель использует обновлённый аудио-кодер Whisper-Large и работает в 8 шагов вывода вместо десятков. Улучшена синхронизация губ и мимики, добавлены поддержка длинных видео и стилизации под аниме или животных. По бенчмаркам на 508 парах аудио-изображение и оценках 770 экспертов модель обходит коммерческие HeyGen и Kling Avatar 2.0. Лицензия — MIT, релиз состоялся 22 мая 2026 года, код выложен в открытый доступ для академического использования.
Для российского предпринимателя это прямой сигнал. Рынок цифровых аватаров, где коммерческие игроки берут деньги за каждую минуту синтетического видео, теперь подмят китайским open-source решением. Стоимость съёмки говорящего ролика стремительно падает к нулю. Если у вас обучающие видео, продуктовые объяснения или маркетинг на разных языках, пересмотрите смету: вам не нужны ни студия, ни актёры. Нужен микрофон и фотография.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
#нейросети #LLM #модели #мультимодальность #Meituan #Китай #инвестиции #будущеетруда #ИИ #технологии #AravanaAI
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.