ChatGPT перестал галлюцинировать на треть — OpenAI обновила модель по умолчанию

OpenAI запустила GPT-5.5 Instant как новую дефолтную модель ChatGPT, неточности упали на 37,3%.

Aravana··1 мин

🔴 ChatGPT перестал галлюцинировать на треть — OpenAI обновила модель по умолчанию

5 мая OpenAI запустила GPT-5.5 Instant, новую дефолтную модель ChatGPT. Главное обещание простое: меньше выдумок, меньше воды, меньше эмодзи. На пользовательских диалогах, помеченных как сомнительные, неточности упали на 37,3%.

В медицинском бенчмарке HealthBench модель набрала 51,4 из 100 против 49,6 у предыдущей. На профессиональной части — 38,4 против 32,9. Цифры выглядят скромно, но в реальном применении именно они отделяют ассистента, которого можно показать врачу или юристу, от ассистента, которого нельзя. Старая GPT-5.3 Instant отключится через три месяца для платных подписчиков, переключение происходит автоматически: вы откроете ChatGPT и просто получите другую модель.

Если используете ChatGPT для бизнес-задач, проверьте свои промпты заново. Модели, обновлённые по тихому, часто меняют поведение тоньше, чем заявлено: ответы становятся короче, формат другой, цитаты подбираются иначе. Отлаженные шаблоны могут начать давать другой результат. Лучше один день на ревизию, чем неделя удивлений.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Google, Microsoft и xAI согласились на госпроверку AI-моделей до релиза

Google, Microsoft и xAI согласились отправлять AI-модели на проверку Минторгу США до публичного релиза.

·1 мин

Китайский «чиповый» фонд впервые вложился в AI-модель — и оценил DeepSeek в $45 млрд

Big Fund — главный государственный полупроводниковый фонд Китая — ведёт раунд DeepSeek при оценке $45 млрд. Старт в марте был при $10 млрд.

·1 мин

Anthropic, Goldman и Blackstone собрали $1,5 млрд — внедрять Claude в портфельные компании частного капитала

Anthropic, Goldman Sachs, Blackstone (плюс Hellman & Friedman, Apollo, General Atlantic) запускают совместное предприятие на $1,5 млрд для внедрения Claude в portfolio-компании.

·1 мин