OpenAI выкатил голос, который думает на лету и переводит за $0,034 в минуту
Три новые realtime-модели OpenAI: голосовой агент с reasoning GPT-5, перевод на 13 языков и стриминговая расшифровка — по тарифам колл-центра.
🔴 OpenAI выкатил голос, который думает на лету и переводит за $0,034 в минуту
Голосовой агент больше не «Сири из 2018». OpenAI выпустил три модели для разработчиков: GPT-Realtime-2 рассуждает на уровне GPT-5 и помнит 128 тысяч токенов контекста, GPT-Realtime-Translate переводит вживую с 70+ языков на 13, GPT-Realtime-Whisper делает потоковую расшифровку речи.
Цифры на минутку. Голос с рассуждением — $32 за миллион входящих аудио-токенов, $64 за исходящие. Перевод — $0,034 за минуту разговора. Расшифровка — $0,017 за минуту. Это уже не «попробовать на хакатоне», это ценник для риелторов Zillow, поддержки Deutsche Telekom и Priceline, которые анонсированы как первые клиенты.
Самое интересное здесь не голос — а то, что слой «человек на телефоне» в бизнес-процессах теперь стоит копейки. Если вы делаете продукт, где клиент звонит, ждёт оператора и слышит «оставайтесь на линии» — у вас примерно полгода до того, как конкурент закроет это голосовым агентом за треть бюджета колл-центра.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
#нейросети #LLM #агентыИИ #мультимодальность #ChatGPT #OpenAI #модели #productivitytools #ИИ #технологии #AravanaAI
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.