Как пользоваться голосовым режимом ChatGPT: разговор с AI в реальном времени

Advanced Voice Mode в ChatGPT — разговор с AI как по телефону. Естественный голос, эмоции, акценты. Показываем, как включить и использовать.

Aravana··2 мин

Что такое голосовой режим ChatGPT

Advanced Voice Mode -- функция ChatGPT, которая позволяет разговаривать с AI голосом в реальном времени. Это не просто «озвучка текста» -- ChatGPT слышит вашу речь, понимает интонацию, может перебивать и реагировать естественно, как в разговоре с человеком.

Бесплатно или платно?

Advanced Voice Mode -- единственный режим голосового общения в ChatGPT с 2026 года. Базовый (Standard) голосовой режим упразднён. Бесплатный план включает ограниченное количество минут Advanced Voice Mode в месяц. Полный доступ -- для подписчиков ChatGPT Plus (на момент написания). Актуальные тарифы на openai.com/pricing.

Доступ из России

Голосовой режим -- часть ChatGPT. Для доступа из России понадобится VPN. Приложение скачайте с сайта OpenAI.

Новое: ChatGPT в Apple CarPlay (апрель 2026)

С марта 2026 года ChatGPT доступен как приложение в Apple CarPlay -- первым среди AI-ассистентов. Требования: iPhone с iOS 26.4 и выше, поддержка CarPlay. В мае 2026 функция доступна пользователям iOS 26.4+, полный запуск продолжается.

Как работает в CarPlay: нажмите иконку ChatGPT на экране автомобиля, задайте вопрос голосом. Приложение работает полностью через голос -- текст и история не отображаются на экране. Wake-word (как у Siri) пока не поддерживается, нужно нажать вручную.

К ChatGPT в CarPlay вскоре присоединятся Grok (от xAI) и Perplexity.

Как включить

На iPhone / Android

Шаг 1. Откройте приложение ChatGPT.

Шаг 2. Нажмите на иконку наушников/микрофона в правом нижнем углу поля ввода.

Шаг 3. Разрешите доступ к микрофону.

Шаг 4. Начните говорить -- ChatGPT ответит голосом.

Шаг 5. Для выбора голоса: нажмите на имя голоса вверху -- выберите из 8 вариантов: 6 классических голосов и 2 новых голоса GPT-Realtime-2 (Cedar и Marin).

На компьютере (Mac / Windows)

В десктопном приложении ChatGPT нажмите иконку микрофона -- голосовой режим работает аналогично мобильному.

В автомобиле (CarPlay)

Обновите iPhone до iOS 26.4+, подключите к CarPlay, найдите ChatGPT в меню приложений и нажмите для разговора.

Что попробовать

- Практикуйте английский. «Let's practice English conversation. You're a barista, I'm ordering coffee.» -- живой диалог с носителем языка.

- Слушайте объяснения. «Объясни квантовую физику как для 5-летнего» -- на ходу, без чтения.

- Мозговой штурм. Обсуждайте идеи голосом -- часто удобнее, чем печатать.

- Подготовка к встречам. «Разыграй собеседование на позицию PM в tech-компании» -- ролевые игры.

- За рулём через CarPlay. «Кратко расскажи новости за сегодня» -- без отвлечения от дороги.

5 советов

1. Используйте на ходу. Голосовой режим идеален для прогулок, вождения и домашних дел.

2. Можно перебивать. В отличие от Siri, ChatGPT можно перебить -- он остановится и послушает.

3. Выберите комфортный голос. 8 голосов с разными тембрами и характерами -- найдите свой. Рекомендуем попробовать новые Cedar и Marin из GPT-Realtime-2.

4. Переключайте язык на лету. Начните на русском, перейдите на английский -- ChatGPT подстроится.

5. В CarPlay -- нажимайте, не ждите. Wake-word пока не работает, поэтому перед вопросом нужно нажать на экран CarPlay.

Важно: Standard Voice Mode упразднён (2026)

В 2025 году OpenAI упразднил Standard Voice Mode -- упрощённый голосовой режим с меньшим качеством. Теперь все пользователи используют только Advanced Voice Mode -- более мощную версию с реальным пониманием интонации, способностью перебивать и естественным диалогом. Бесплатный план получает ограниченный доступ к Advanced Voice Mode.

Важное обновление: Advanced Voice Mode теперь работает на базе GPT-5, а не GPT-4o. Переход произошёл в апреле 2026 года и принёс заметные улучшения в понимании контекста и естественности речи. GPT-5 лучше справляется с длинными разговорами, не теряя нить беседы и точнее реагируя на эмоциональные нюансы.

Live Camera - новая функция Advanced Voice Mode, позволяющая ChatGPT видеть окружающий мир через камеру смартфона в реальном времени. Вы можете спросить у GPT-5, что находится перед вами, попросить объяснить текст на вывеске на иностранном языке или получить совет по сборке мебели, показав инструкцию. Функция доступна подписчикам Plus и выше.

Voice Mode на GPT-5.5 Instant

Текущая базовая модель ChatGPT Voice Mode обновлена до GPT-5.5 Instant (июнь 2026). Обновление принесло улучшенное понимание контекста в длинных разговорах, более естественные переходы между репликами и сниженную задержку отклика.

История версий голосовой модели. GPT-5.2, использовавшийся ранее в Voice Mode, выведен из эксплуатации 12 июня 2026 года. Текущая модель голосового режима -- GPT-5.5 (также в варианте GPT-5.5 Instant для сниженной задержки). GPT-5.6 находится в разработке и ожидается позднее в 2026 году. Если вы использовали старые API-интеграции с голосовым режимом на базе GPT-5.2, необходимо обновить их на актуальный endpoint.

Как использовать Voice Mode

Нажмите на кнопку наушников в нижней части ChatGPT. Первый запуск может занять несколько секунд для подключения. Прервать ответ можно нажатием или просто начав говорить -- AI остановится и будет слушать. Для смены голоса: Настройки -- Голос -- выберите из доступных вариантов. Advanced Voice Mode требует Plus или Pro подписки.

Практические сценарии

Voice Mode удобен для разговорной практики на иностранном языке -- попросите ChatGPT разговаривать только на целевом языке и исправлять ошибки. Для прослушивания длинных ответов во время поездки: задайте вопрос и слушайте ответ как подкаст. Для мозгового штурма: голосом идеи генерируются быстрее, чем при наборе текста.

Memory Sources (2026): в голосовом режиме ChatGPT теперь показывает, какие сохранённые воспоминания он использует при ответе. Иконка памяти появляется рядом с ответом -- нажмите, чтобы увидеть задействованные факты.

Обновление качества голоса (май 2026): Advanced Voice Mode получил улучшения -- более тонкая интонация, реалистичный ритм речи и богатый эмоциональный диапазон. Гибридный режим голос+текст: теперь можно переключиться в Voice Mode прямо посреди текстовой беседы и вернуться обратно без сброса контекста разговора -- вся история сохраняется. Живые виджеты в голосовом режиме: при вопросах о погоде и маршрутах ChatGPT отображает интерактивные виджеты с картами и прогнозом прямо в интерфейсе. Новый режим непрерывного перевода: ChatGPT переводит разговор в реальном времени между двумя собеседниками, говорящими на разных языках.

Детальная настройка голосового режима

Настройка на iOS

  1. Скачайте ChatGPT из App Store (или обновите до последней версии).
  2. Откройте приложение -- войдите в аккаунт.
  3. Нажмите иконку наушников в правом нижнем углу поля ввода.
  4. При первом запуске дайте разрешение на доступ к микрофону.
  5. Выбор голоса: нажмите на название голоса вверху экрана в режиме голосового общения -- откроется список из 6 вариантов (Alloy, Echo, Fable, Onyx, Nova, Shimmer). Каждый можно прослушать до выбора.
  6. Язык: голосовой режим автоматически определяет язык. Для переключения достаточно начать говорить на другом языке.

Настройка на Android

  1. Скачайте ChatGPT из Google Play или с сайта openai.com/chatgpt.
  2. Шаги 2-6 идентичны iOS. Единственное отличие: на некоторых Android-устройствах нужно дополнительно разрешить работу микрофона в фоне в настройках приложения.

Выбор голоса: 6 вариантов

ChatGPT предлагает 8 голосов с разными характерами. Классические голоса: Alloy -- нейтральный, универсальный; Echo -- мягкий, задумчивый; Fable -- тёплый, повествовательный; Onyx -- глубокий, авторитетный; Nova -- энергичный, молодой; Shimmer -- спокойный, размеренный. Голоса GPT-Realtime-2 (новые): Cedar -- естественный, разговорный; Marin -- чёткий, профессиональный. Все голоса работают на любом языке -- переключайтесь в разговоре без ограничений.

Изучение языков голосом

Голосовой режим -- один из лучших инструментов для практики разговорного языка. Вот конкретный сценарий практики английского:

Начните сессию фразой: «Let's practice English conversation. I'm an intermediate learner. Please speak at a normal pace and correct my grammar mistakes gently after each of my responses.»

ChatGPT войдёт в роль разговорного партнёра. После каждой вашей реплики он продолжит разговор -- и мягко укажет на ошибки: «By the way, instead of 'I go yesterday', it's more natural to say 'I went yesterday' -- past tense. But great sentence structure!»

Можно сделать практику ещё интереснее:

  • «You're a barista at a London coffee shop. I'm a customer. Let's roleplay.»
  • «Give me 5 random topics, I'll speak about each for 1 minute, then you give feedback.»
  • «Only respond in English, even if I accidentally switch to Russian.»

ChatGPT в CarPlay

С марта 2026 года ChatGPT стал первым AI-ассистентом в Apple CarPlay. Требования для использования:

  • iPhone с iOS 26.4 или новее.
  • Приложение ChatGPT обновлено до последней версии.
  • Автомобиль с поддержкой CarPlay (проводной или беспроводной).
  • Аккаунт ChatGPT (бесплатный или Plus).

Как настроить: подключите iPhone к CarPlay, найдите иконку ChatGPT в меню приложений CarPlay. Если иконки нет -- откройте Настройки iPhone -- Основные -- CarPlay -- выберите свой автомобиль -- добавьте ChatGPT в список приложений.

Команды за рулём: нажмите иконку ChatGPT на экране автомобиля (wake-word пока не поддерживается), затем говорите. Примеры: «Кратко расскажи о пробках на трассе М4»; «Что почитать по управлению командой -- кратко»; «Составь список дел на сегодня и напомни мне позже»; «Переведи эту фразу на английский для деловых переговоров».

Непрерывный перевод в реальном времени

Голосовой режим ChatGPT можно использовать как синхронный переводчик. Это один из самых неожиданных, но практичных сценариев.

Практический пример: вы на международной конференции, рядом иностранный коллега говорит по-немецки. Откройте ChatGPT Voice Mode, скажите: «Act as a simultaneous interpreter. I'll speak in Russian, translate to English. When someone speaks English near me, translate to Russian.»

Держите телефон между собой и собеседником. ChatGPT будет переводить реплики в обе стороны в режиме реального времени с задержкой 1-2 секунды. Для коротких деловых разговоров это работает очень хорошо.

Советы для лучшего качества звука

  • Тихое место. Голосовой режим плохо справляется с сильным фоновым шумом. В кафе или на улице качество распознавания падает. Используйте наушники с микрофоном.
  • Чёткое произношение. Говорите чуть медленнее, чем обычно -- это снижает количество ошибок распознавания, особенно для технических терминов.
  • Скорость речи. Если ChatGPT говорит слишком быстро -- скажите ему: «Говори медленнее». Если слишком медленно -- «Говори в нормальном темпе». ChatGPT адаптируется сразу.
  • Перебивайте смело. В отличие от Siri и Google Ассистента, ChatGPT можно перебить в любой момент. Он немедленно остановится и выслушает вас.
  • Длинные паузы. Если вы думаете -- скажите «подожди секунду». Иначе ChatGPT может решить, что сессия завершена.

Улучшения голосового режима (июнь 2026): Голос стал естественнее: более тонкая интонация, реалистичные паузы и ритм речи, выразительная передача эмоций. Снижено количество случайных прерываний (false wake). Персонализация GPT-5.5 для тарифов Go и Free (доступна с 9 июня 2026): память ChatGPT теперь просматривает прошлые беседы, загруженные файлы и подключённый Gmail для формирования более точных и контекстных ответов. Пользователи Go и Free получают ту же персонализированную модель, что ранее была доступна только подписчикам Pro.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: research

Поделиться:TelegramXLinkedIn
Как вам материал?

Читайте также

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Как начать пользоваться Vidu: AI-генератор видео из текста и фото

Полный гайд по Vidu -- китайскому AI-сервису для создания видео. Бесплатный тариф, три режима генерации: из текста, из фото и по референсу. Никакой установки -- работает в браузере.

·7 мин

Как начать пользоваться Cline: автономный AI-агент для кода прямо в VS Code

Полный гайд по Cline -- open-source AI-агенту для VS Code с 5 миллионами установок. Работает с любой моделью, редактирует файлы, выполняет команды в терминале, открывает браузер. Apache 2.0, bring-your-own-key.

·7 мин

Как начать пользоваться CodeRabbit: AI-ревью кода прямо в GitHub и GitLab

Гайд по CodeRabbit -- самому популярному AI-инструменту для автоматического ревью кода. 2 миллиона репозиториев, поддержка GitHub, GitLab, Azure DevOps и Bitbucket. Бесплатно для open-source проектов.

·7 мин