Google выпустил новое поколение AI-голоса — теперь он умеет чувствовать
Google DeepMind выпустил Gemini 3.1 Flash TTS — модель синтеза речи нового поколения с выразительными интонациями и эмоциями, которая разворачивается в продуктах Google.
🔴 Google выпустил новое поколение AI-голоса — теперь он умеет чувствовать
Google DeepMind выпустил Gemini 3.1 Flash TTS — новую модель синтеза речи, которая умеет передавать интонацию, паузы и эмоции. Не просто читать текст вслух — а говорить.
До сих пор AI-голос звучал как диктор на автоответчике: правильно, но мёртво. Flash TTS делает ставку на другое — на выразительность. Одно и то же предложение может звучать по-разному: с удивлением, теплотой или иронией, в зависимости от контекста.
Это меняет всё, что говорит вслух: ассистенты, аудиокниги, обучающие платформы, колл-центры. Разница между «роботом на горячей линии» и «человеком, который реально помог» — часто именно в интонации.
Модель разворачивается в продуктах Google.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
NVIDIA вышла на поле OpenAI: своя AI-модель, открытая, в 9 раз быстрее
NVIDIA выпустила открытую мультимодальную модель Nemotron 3 Nano Omni — она понимает текст, картинки, видео и звук, выдаёт в 9 раз больше запросов в секунду, чем другие открытые модели. Foxconn и Palantir уже подключили её, Oracle и Dell оценивают.