ByteDance сделала AI, который слушает тебя, пока говорит — и дала его 500 миллионам людей
Первая в мире полнодуплексная голосовая AI-модель уже доступна сотням миллионов пользователей Doubao — AI слушает и говорит одновременно, как человек
ByteDance сделала AI, который слушает тебя, пока говорит — и дала его 500 миллионам людей
Попробуйте поговорить с голосовым AI. В 99% случаев это неловкий опыт: вы говорите — AI молчит, потом отвечает — и замолкает снова. Как рация. Не разговор, а пинг-понг.
ByteDance представила Seeduplex — первую в мире голосовую AI-модель, которая умеет слушать и говорить одновременно. Как живой собеседник. Она не ждёт, пока вы закончите фразу, не перебивает невпопад, а подстраивается в реальном времени — точно как человек в обычном разговоре.
Цифры впечатляют: скорость отклика выросла на 250 миллисекунд, ложные прерывания сократились вдвое, а общая удовлетворённость звонками выросла на 8%.
И главное: это не лабораторный демо. Seeduplex уже работает в приложении Doubao — китайском аналоге ChatGPT от ByteDance, которым пользуются сотни миллионов человек. Пока OpenAI и Google совершенствуют голосовые режимы для избранных подписчиков, ByteDance тихо раскатала полноценный голосовой AI на массовый рынок.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
- ByteDance готовит глобальный запуск Seedance 2.0 с IP-защитой
ByteDance одновременно захватывает голосовой AI (Seeduplex) и видео-AI (Seedance 2.0). Оба материала показывают полноту AI-стратегии компании.
- Google выпустил Gemini 3.1 Flash Live — модель для real-time аудио-AI
Оба продукта атакуют один рынок — real-time голосовой AI. ByteDance имеет 500 млн пользователей, Google — инфраструктуру. Прямая конкуренция.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их
ByteDance выложила Lance — мультимодальную модель на 3 миллиарда параметров под Apache 2.0. Понимает и генерирует картинки и видео, редактирует одним промптом, работает локально на одной карте с 40 ГБ видеопамяти. Лучшие баллы среди унифицированных моделей по GenEval, VBench и GEdit-Bench.