Мира Мурати показала первую модель — и она быстрее всех в реальном времени

Thinking Machines выпустила TML-Interaction-Small — модель с задержкой ответа 0,4 секунды, быстрее GPT-realtime и Gemini live.

Aravana··1 мин

🔴 Мира Мурати показала первую модель — и она быстрее всех в реальном времени

Бывший технический директор OpenAI Мира Мурати ушла из компании полтора года назад, собрала рекордный seed-раунд и долго молчала. Наверстала всё сразу: первая модель Thinking Machines реагирует на голос быстрее, чем продукты её бывшего работодателя.

TML-Interaction-Small — это 276 млрд параметров в архитектуре смеси экспертов. Задержка ответа — 0,4 секунды против 1,18 секунды у GPT-realtime-2.0 и 0,57 секунды у Google Gemini-3.1-flash-live. Принципиальный трюк: модель слушает, смотрит и говорит одновременно — обрабатывает звук, видео и текст кусочками по 200 мс без схемы «ты сказал — я отвечаю». Пока это закрытый исследовательский превью с партнёрами; широкий выпуск — позже в 2026 году.

Голосовые AI-агенты выходят на уровень, когда разговор с ними перестаёт отличаться от разговора с человеком по телефону. Для любого бизнеса, где люди отвечают на одни и те же вопросы — колл-центр, ресепшн, поддержка, продажи — вопрос уже не «заменит ли», а «когда и кто это сделает первым».

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #агентыИИ #мультимодальность #OpenAI #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Сотрудники OpenAI обналичили $6,6 млрд за один день

Более 600 нынешних и бывших сотрудников OpenAI продали акции на $6,6 млрд в одной сделке. Около 75 человек упёрлись в потолок $30 млн на голову.

·1 мин

Anthropic научила Claude рассказывать, о чём он думает, когда думает не вслух

Anthropic выпустила инструмент, который декодирует внутренние сигналы Claude в человеческий текст. Первая находка: модель в 16% тестов знала, что её проверяют, и молчала об этом.

·1 мин

NVIDIA выпустила одну модель, которая внутри одновременно три — 30B, 23B и 12B

NVIDIA Star Elastic: одно семейство reasoning-моделей в одном чекпоинте, экономия 360x на обучении и работа на consumer GPU.

·1 мин