ByteDance сделала AI, который слушает тебя, пока говорит — и дала его 500 миллионам людей

Первая в мире полнодуплексная голосовая AI-модель уже доступна сотням миллионов пользователей Doubao — AI слушает и говорит одновременно, как человек

Aravana··1 мин

ByteDance сделала AI, который слушает тебя, пока говорит — и дала его 500 миллионам людей

Попробуйте поговорить с голосовым AI. В 99% случаев это неловкий опыт: вы говорите — AI молчит, потом отвечает — и замолкает снова. Как рация. Не разговор, а пинг-понг.

ByteDance представила Seeduplex — первую в мире голосовую AI-модель, которая умеет слушать и говорить одновременно. Как живой собеседник. Она не ждёт, пока вы закончите фразу, не перебивает невпопад, а подстраивается в реальном времени — точно как человек в обычном разговоре.

Цифры впечатляют: скорость отклика выросла на 250 миллисекунд, ложные прерывания сократились вдвое, а общая удовлетворённость звонками выросла на 8%.

И главное: это не лабораторный демо. Seeduplex уже работает в приложении Doubao — китайском аналоге ChatGPT от ByteDance, которым пользуются сотни миллионов человек. Пока OpenAI и Google совершенствуют голосовые режимы для избранных подписчиков, ByteDance тихо раскатала полноценный голосовой AI на массовый рынок.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Читайте также

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Google DeepMind научил ИИ строить интерактивные миры поверх реальных улиц планеты

Google DeepMind подключил к своей world-модели Genie базу Street View. Waymo уже использует генератор для тренировки беспилотников на редких сценариях.

·1 мин

Китайский StepFun выпустил голосовую модель, которая ловит интонации и не выпадает из роли

Шанхайская лаборатория StepFun представила StepAudio 2.5 Realtime — голосовую модель, которая слышит тон и паузы и держит выбранный персонаж в долгих диалогах.

·1 мин

ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их

ByteDance выложила Lance — мультимодальную модель на 3 миллиарда параметров под Apache 2.0. Понимает и генерирует картинки и видео, редактирует одним промптом, работает локально на одной карте с 40 ГБ видеопамяти. Лучшие баллы среди унифицированных моделей по GenEval, VBench и GEdit-Bench.

·1 мин