Как пользоваться голосовым режимом ChatGPT: разговор с AI в реальном времени
Advanced Voice Mode в ChatGPT — разговор с AI как по телефону. Естественный голос, эмоции, акценты. Показываем, как включить и использовать.
Что такое голосовой режим ChatGPT
Advanced Voice Mode -- функция ChatGPT, которая позволяет разговаривать с AI голосом в реальном времени. Это не просто «озвучка текста» -- ChatGPT слышит вашу речь, понимает интонацию, может перебивать и реагировать естественно, как в разговоре с человеком.
Бесплатно или платно?
Advanced Voice Mode -- единственный режим голосового общения в ChatGPT с 2026 года. Базовый (Standard) голосовой режим упразднён. Бесплатный план включает ограниченное количество минут Advanced Voice Mode в месяц. Полный доступ -- для подписчиков ChatGPT Plus (на момент написания). Актуальные тарифы на openai.com/pricing.
Доступ из России
Голосовой режим -- часть ChatGPT. Для доступа из России понадобится VPN. Приложение скачайте с сайта OpenAI.
Новое: ChatGPT в Apple CarPlay (апрель 2026)
С марта 2026 года ChatGPT доступен как приложение в Apple CarPlay -- первым среди AI-ассистентов. Требования: iPhone с iOS 26.4 и выше, поддержка CarPlay. В мае 2026 функция доступна пользователям iOS 26.4+, полный запуск продолжается.
Как работает в CarPlay: нажмите иконку ChatGPT на экране автомобиля, задайте вопрос голосом. Приложение работает полностью через голос -- текст и история не отображаются на экране. Wake-word (как у Siri) пока не поддерживается, нужно нажать вручную.
К ChatGPT в CarPlay вскоре присоединятся Grok (от xAI) и Perplexity.
Как включить
На iPhone / Android
Шаг 1. Откройте приложение ChatGPT.
Шаг 2. Нажмите на иконку наушников/микрофона в правом нижнем углу поля ввода.
Шаг 3. Разрешите доступ к микрофону.
Шаг 4. Начните говорить -- ChatGPT ответит голосом.
Шаг 5. Для выбора голоса: нажмите на имя голоса вверху -- выберите из 8 вариантов: 6 классических голосов и 2 новых голоса GPT-Realtime-2 (Cedar и Marin).
На компьютере (Mac / Windows)
В десктопном приложении ChatGPT нажмите иконку микрофона -- голосовой режим работает аналогично мобильному.
В автомобиле (CarPlay)
Обновите iPhone до iOS 26.4+, подключите к CarPlay, найдите ChatGPT в меню приложений и нажмите для разговора.
Что попробовать
- Практикуйте английский. «Let's practice English conversation. You're a barista, I'm ordering coffee.» -- живой диалог с носителем языка.
- Слушайте объяснения. «Объясни квантовую физику как для 5-летнего» -- на ходу, без чтения.
- Мозговой штурм. Обсуждайте идеи голосом -- часто удобнее, чем печатать.
- Подготовка к встречам. «Разыграй собеседование на позицию PM в tech-компании» -- ролевые игры.
- За рулём через CarPlay. «Кратко расскажи новости за сегодня» -- без отвлечения от дороги.
5 советов
1. Используйте на ходу. Голосовой режим идеален для прогулок, вождения и домашних дел.
2. Можно перебивать. В отличие от Siri, ChatGPT можно перебить -- он остановится и послушает.
3. Выберите комфортный голос. 8 голосов с разными тембрами и характерами -- найдите свой. Рекомендуем попробовать новые Cedar и Marin из GPT-Realtime-2.
4. Переключайте язык на лету. Начните на русском, перейдите на английский -- ChatGPT подстроится.
5. В CarPlay -- нажимайте, не ждите. Wake-word пока не работает, поэтому перед вопросом нужно нажать на экран CarPlay.
Важно: Standard Voice Mode упразднён (2026)
В 2025 году OpenAI упразднил Standard Voice Mode -- упрощённый голосовой режим с меньшим качеством. Теперь все пользователи используют только Advanced Voice Mode -- более мощную версию с реальным пониманием интонации, способностью перебивать и естественным диалогом. Бесплатный план получает ограниченный доступ к Advanced Voice Mode.
Важное обновление: Advanced Voice Mode теперь работает на базе GPT-5, а не GPT-4o. Переход произошёл в апреле 2026 года и принёс заметные улучшения в понимании контекста и естественности речи. GPT-5 лучше справляется с длинными разговорами, не теряя нить беседы и точнее реагируя на эмоциональные нюансы.
Live Camera - новая функция Advanced Voice Mode, позволяющая ChatGPT видеть окружающий мир через камеру смартфона в реальном времени. Вы можете спросить у GPT-5, что находится перед вами, попросить объяснить текст на вывеске на иностранном языке или получить совет по сборке мебели, показав инструкцию. Функция доступна подписчикам Plus и выше.
Voice Mode на GPT-5.5 Instant
Текущая базовая модель ChatGPT Voice Mode обновлена до GPT-5.5 Instant (июнь 2026). Обновление принесло улучшенное понимание контекста в длинных разговорах, более естественные переходы между репликами и сниженную задержку отклика.
История версий голосовой модели. GPT-5.2, использовавшийся ранее в Voice Mode, выведен из эксплуатации 12 июня 2026 года. Текущая модель голосового режима -- GPT-5.5 (также в варианте GPT-5.5 Instant для сниженной задержки). GPT-5.6 находится в разработке и ожидается позднее в 2026 году. Если вы использовали старые API-интеграции с голосовым режимом на базе GPT-5.2, необходимо обновить их на актуальный endpoint.
Как использовать Voice Mode
Нажмите на кнопку наушников в нижней части ChatGPT. Первый запуск может занять несколько секунд для подключения. Прервать ответ можно нажатием или просто начав говорить -- AI остановится и будет слушать. Для смены голоса: Настройки -- Голос -- выберите из доступных вариантов. Advanced Voice Mode требует Plus или Pro подписки.
Практические сценарии
Voice Mode удобен для разговорной практики на иностранном языке -- попросите ChatGPT разговаривать только на целевом языке и исправлять ошибки. Для прослушивания длинных ответов во время поездки: задайте вопрос и слушайте ответ как подкаст. Для мозгового штурма: голосом идеи генерируются быстрее, чем при наборе текста.
Memory Sources (2026): в голосовом режиме ChatGPT теперь показывает, какие сохранённые воспоминания он использует при ответе. Иконка памяти появляется рядом с ответом -- нажмите, чтобы увидеть задействованные факты.
Обновление качества голоса (май 2026): Advanced Voice Mode получил улучшения -- более тонкая интонация, реалистичный ритм речи и богатый эмоциональный диапазон. Гибридный режим голос+текст: теперь можно переключиться в Voice Mode прямо посреди текстовой беседы и вернуться обратно без сброса контекста разговора -- вся история сохраняется. Живые виджеты в голосовом режиме: при вопросах о погоде и маршрутах ChatGPT отображает интерактивные виджеты с картами и прогнозом прямо в интерфейсе. Новый режим непрерывного перевода: ChatGPT переводит разговор в реальном времени между двумя собеседниками, говорящими на разных языках.
Детальная настройка голосового режима
Настройка на iOS
- Скачайте ChatGPT из App Store (или обновите до последней версии).
- Откройте приложение -- войдите в аккаунт.
- Нажмите иконку наушников в правом нижнем углу поля ввода.
- При первом запуске дайте разрешение на доступ к микрофону.
- Выбор голоса: нажмите на название голоса вверху экрана в режиме голосового общения -- откроется список из 6 вариантов (Alloy, Echo, Fable, Onyx, Nova, Shimmer). Каждый можно прослушать до выбора.
- Язык: голосовой режим автоматически определяет язык. Для переключения достаточно начать говорить на другом языке.
Настройка на Android
- Скачайте ChatGPT из Google Play или с сайта openai.com/chatgpt.
- Шаги 2-6 идентичны iOS. Единственное отличие: на некоторых Android-устройствах нужно дополнительно разрешить работу микрофона в фоне в настройках приложения.
Выбор голоса: 6 вариантов
ChatGPT предлагает 8 голосов с разными характерами. Классические голоса: Alloy -- нейтральный, универсальный; Echo -- мягкий, задумчивый; Fable -- тёплый, повествовательный; Onyx -- глубокий, авторитетный; Nova -- энергичный, молодой; Shimmer -- спокойный, размеренный. Голоса GPT-Realtime-2 (новые): Cedar -- естественный, разговорный; Marin -- чёткий, профессиональный. Все голоса работают на любом языке -- переключайтесь в разговоре без ограничений.
Изучение языков голосом
Голосовой режим -- один из лучших инструментов для практики разговорного языка. Вот конкретный сценарий практики английского:
Начните сессию фразой: «Let's practice English conversation. I'm an intermediate learner. Please speak at a normal pace and correct my grammar mistakes gently after each of my responses.»
ChatGPT войдёт в роль разговорного партнёра. После каждой вашей реплики он продолжит разговор -- и мягко укажет на ошибки: «By the way, instead of 'I go yesterday', it's more natural to say 'I went yesterday' -- past tense. But great sentence structure!»
Можно сделать практику ещё интереснее:
- «You're a barista at a London coffee shop. I'm a customer. Let's roleplay.»
- «Give me 5 random topics, I'll speak about each for 1 minute, then you give feedback.»
- «Only respond in English, even if I accidentally switch to Russian.»
ChatGPT в CarPlay
С марта 2026 года ChatGPT стал первым AI-ассистентом в Apple CarPlay. Требования для использования:
- iPhone с iOS 26.4 или новее.
- Приложение ChatGPT обновлено до последней версии.
- Автомобиль с поддержкой CarPlay (проводной или беспроводной).
- Аккаунт ChatGPT (бесплатный или Plus).
Как настроить: подключите iPhone к CarPlay, найдите иконку ChatGPT в меню приложений CarPlay. Если иконки нет -- откройте Настройки iPhone -- Основные -- CarPlay -- выберите свой автомобиль -- добавьте ChatGPT в список приложений.
Команды за рулём: нажмите иконку ChatGPT на экране автомобиля (wake-word пока не поддерживается), затем говорите. Примеры: «Кратко расскажи о пробках на трассе М4»; «Что почитать по управлению командой -- кратко»; «Составь список дел на сегодня и напомни мне позже»; «Переведи эту фразу на английский для деловых переговоров».
Непрерывный перевод в реальном времени
Голосовой режим ChatGPT можно использовать как синхронный переводчик. Это один из самых неожиданных, но практичных сценариев.
Практический пример: вы на международной конференции, рядом иностранный коллега говорит по-немецки. Откройте ChatGPT Voice Mode, скажите: «Act as a simultaneous interpreter. I'll speak in Russian, translate to English. When someone speaks English near me, translate to Russian.»
Держите телефон между собой и собеседником. ChatGPT будет переводить реплики в обе стороны в режиме реального времени с задержкой 1-2 секунды. Для коротких деловых разговоров это работает очень хорошо.
Советы для лучшего качества звука
- Тихое место. Голосовой режим плохо справляется с сильным фоновым шумом. В кафе или на улице качество распознавания падает. Используйте наушники с микрофоном.
- Чёткое произношение. Говорите чуть медленнее, чем обычно -- это снижает количество ошибок распознавания, особенно для технических терминов.
- Скорость речи. Если ChatGPT говорит слишком быстро -- скажите ему: «Говори медленнее». Если слишком медленно -- «Говори в нормальном темпе». ChatGPT адаптируется сразу.
- Перебивайте смело. В отличие от Siri и Google Ассистента, ChatGPT можно перебить в любой момент. Он немедленно остановится и выслушает вас.
- Длинные паузы. Если вы думаете -- скажите «подожди секунду». Иначе ChatGPT может решить, что сессия завершена.
Улучшения голосового режима (июнь 2026): Голос стал естественнее: более тонкая интонация, реалистичные паузы и ритм речи, выразительная передача эмоций. Снижено количество случайных прерываний (false wake). Персонализация GPT-5.5 для тарифов Go и Free (доступна с 9 июня 2026): память ChatGPT теперь просматривает прошлые беседы, загруженные файлы и подключённый Gmail для формирования более точных и контекстных ответов. Пользователи Go и Free получают ту же персонализированную модель, что ранее была доступна только подписчикам Pro.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
- Как начать пользоваться ElevenLabs: AI-озвучка, клонирование голоса и дубляж
ElevenLabs предлагает более продвинутые голосовые возможности: клонирование голоса и профессиональная озвучка
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Как начать пользоваться Vidu: AI-генератор видео из текста и фото
Полный гайд по Vidu -- китайскому AI-сервису для создания видео. Бесплатный тариф, три режима генерации: из текста, из фото и по референсу. Никакой установки -- работает в браузере.
Как начать пользоваться Cline: автономный AI-агент для кода прямо в VS Code
Полный гайд по Cline -- open-source AI-агенту для VS Code с 5 миллионами установок. Работает с любой моделью, редактирует файлы, выполняет команды в терминале, открывает браузер. Apache 2.0, bring-your-own-key.
Как начать пользоваться CodeRabbit: AI-ревью кода прямо в GitHub и GitLab
Гайд по CodeRabbit -- самому популярному AI-инструменту для автоматического ревью кода. 2 миллиона репозиториев, поддержка GitHub, GitLab, Azure DevOps и Bitbucket. Бесплатно для open-source проектов.