Все Insights
AI·

GPT-5.4: миллион токенов контекста и автономные задачи на уровне человека

OpenAI выпустила модель с контекстом в миллион токенов и нативным управлением компьютером — впервые AI-агент работает с вашим браузером и рабочим столом напрямую.

Aravana··4 мин

Тип материала: research

Поделиться:TelegramXLinkedIn
Как вам материал?

GPT-5.4, представленная 5 марта 2026 года, — не просто апдейт. Это первая модель OpenAI с контекстным окном в 1 миллион токенов — примерно 750 тысяч слов, или семь книг «Гарри Поттера» за один промпт. Но настоящий прорыв — не в контексте, а в действиях: GPT-5.4 умеет напрямую управлять браузером и рабочим столом, превосходя человеческий базовый уровень на специализированных бенчмарках.

Факты по качеству: индивидуальные утверждения модели на 33% реже оказываются ложными, чем в GPT-5.2, а полные ответы содержат ошибки на 18% реже. GPT-5.4 объединяет в себе возможности кодинг-модели GPT-5.3-Codex и рассуждающих моделей предыдущего поколения. Доступна в трёх вариантах: стандартная, Pro и Thinking — последняя для задач, где нужно пошаговое рассуждение.

Миллион токенов контекста меняет правила игры для разработчиков и аналитиков. Можно загрузить целый репозиторий кода, годовой финансовый отчёт или корпус юридических документов — и модель будет работать с ними как единым целым. API доступен с полным миллионным контекстом, что делает GPT-5.4 инструментом для построения автономных агентов, способных планировать, выполнять и проверять задачи на длинных горизонтах.

Нативное управление компьютером — ключевая новинка. GPT-5.4 может открывать сайты, заполнять формы, работать с файлами и выполнять многошаговые задачи без специальных плагинов. Это первый шаг к AI-ассистентам, которые не просто советуют, а делают. Модель доступна для подписчиков ChatGPT Pro и Enterprise, а также через API — и конкуренция с Claude и Gemini за звание лучшего AI-агента выходит на новый уровень.

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Qwen3-Omni от Alibaba: мультимодальная модель на 119 языках

Alibaba выпустила модель, которая понимает текст, изображения, аудио и видео, а затем отвечает голосом в реальном времени — и всё это под открытой лицензией Apache 2.0.

·4 мин

MiniMax M2.5: китайская модель уровня Claude Opus за долю цены

Шанхайский стартап MiniMax выпустил модель, которая на бенчмарках не уступает лучшим западным моделям — но стоит в 10 раз дешевле.

·3 мин

Luma Uni-1: модель, которая думает, пока создаёт изображения

Luma AI представила первую модель, объединяющую рассуждение и генерацию картинок в одной архитектуре — и она обходит Google и OpenAI на логических бенчмарках.

·3 мин