Claude Opus 4.6: миллион токенов контекста и что это меняет на практике

Anthropic выпустила Claude Opus 4.6 с контекстным окном в 1 миллион токенов. Разбираемся, почему длинный контекст — это не просто маркетинговая цифра, а фундаментальный сдвиг в возможностях AI.

Aravana·2026-02-05·4 мин

Ключевые выводы

— Claude Opus 4.6 получил контекстное окно в 1 млн токенов — это примерно 750 000 слов, или около 3 000 страниц текста в одном запросе.
— Модель демонстрирует улучшения в рассуждениях, многошаговом планировании и работе с кодом по сравнению с Opus 4.5.
— Длинный контекст открывает новые классы задач: анализ целых кодовых баз, юридических корпусов и научных архивов без потери информации.

5 февраля 2026 года Anthropic представила Claude Opus 4.6 — новую флагманскую модель с контекстным окном в 1 миллион токенов. Миллион токенов — это примерно 750 000 слов на английском языке, что эквивалентно нескольким толстым романам или полной кодовой базе среднего стартапа. Если раньше работа с большими объёмами текста требовала разбиения на части и потери контекста между ними, теперь можно загрузить всё целиком.

Контекстное окно — один из самых важных параметров языковой модели, и его значение часто недооценивают. Представьте себе аналитика, который может одновременно держать перед глазами все документы компании за год — финансовую отчётность, переписку, контракты, код, презентации. Именно это даёт миллион токенов. Модель с контекстом в 8 000 токенов (стандарт GPT-3.5 в 2023 году) — это аналитик, который видит одну страницу за раз и полагается на память.

Эволюция контекстного окна

Для понимания масштаба: GPT-4 при запуске в марте 2023 года имел контекст в 8 192 токена, с расширенной версией до 32 768. Claude 2 в июле 2023 — 100 000. Gemini 1.5 Pro в феврале 2024 — до 1 млн, но с заметной деградацией качества на длинных контекстах. Claude Opus 4.6, по заявлениям Anthropic и первым независимым тестам, сохраняет высокое качество ответов даже при загрузке контекста близко к максимуму.

Помимо длины контекста, Opus 4.6 показывает улучшения в нескольких ключевых областях. В бенчмарке GPQA Diamond (graduate-level science questions) модель набирает по некоторым оценкам более 72%, что ставит её на уровень лучших моделей в мире. В задачах программирования на SWE-bench Verified (реальные issues из GitHub-репозиториев) модель также демонстрирует прогресс, особенно в задачах, требующих понимания большого объёма кода.

Практические сценарии применения

Что это значит на практике? Мы видим несколько конкретных сценариев, которые раньше были невозможны или крайне неудобны. Первый — анализ юридических документов. Типичный договор M&A может содержать 200-500 страниц основного текста плюс приложения. Раньше юристы использовали RAG-системы (Retrieval-Augmented Generation) для работы с такими объёмами, но RAG неизбежно теряет контекст между фрагментами. Opus 4.6 может прочитать весь документ целиком и ответить на вопросы, учитывая все перекрёстные ссылки и оговорки.

Второй сценарий — разработка ПО. Средний проект на 50 000 строк кода (типичный продукт стартапа) — это примерно 500 000-700 000 токенов с учётом документации и тестов. Opus 4.6 может загрузить такой проект целиком и работать с ним как единым целым: находить баги, рефакторить архитектуру, писать тесты с учётом всех зависимостей. Инструменты вроде Claude Code от Anthropic уже используют эту возможность.

Третий сценарий — исследования. Учёный может загрузить 20-30 научных статей (каждая по 10 000-20 000 токенов) и попросить модель найти противоречия между ними, выделить общие паттерны или предложить новые гипотезы. Раньше это требовало либо ручного чтения, либо сложных пайплайнов с промежуточным суммированием, которые теряли нюансы.

Конкуренция и экономика длинного контекста

Конкуренция в области длинного контекста обостряется. Google Gemini 1.5 Pro и Gemini 2.0 также поддерживают миллион токенов. OpenAI GPT-5 предлагает 256 000 токенов в стандартном режиме. Но длина контекста — это не единственный параметр. Критично качество: насколько точно модель использует информацию из начала контекста при генерации ответа? Исследования показывают, что многие модели страдают от «lost in the middle» — информация в середине длинного контекста обрабатывается хуже, чем в начале или в конце. Anthropic заявляет, что Opus 4.6 существенно уменьшает этот эффект.

Экономика использования тоже важна. Обработка 1 млн токенов на входе стоит заметных денег. При текущих ценах Anthropic API ($15 за 1 млн входных токенов для Opus) полное заполнение контекстного окна обойдётся в $15 за один запрос. Это дорого для массового использования, но вполне приемлемо для задач, где альтернатива — часы работы высокооплачиваемого специалиста. Юрист, который берёт $500/час и тратит 4 часа на анализ документа, обходится в $2 000. AI делает это за $15 и 2 минуты.

Есть и более глубокий технический вопрос: является ли длинный контекст заменой RAG или они дополняют друг друга? Наше мнение: для большинства практических задач длинный контекст проще, надёжнее и даёт лучшие результаты. RAG остаётся полезным, когда объём данных действительно превышает возможности контекстного окна (например, база знаний в миллионы документов) или когда данные постоянно обновляются. Но для задач «прочитай эти 50 файлов и ответь» — длинный контекст побеждает.

Стратегическое значение для Anthropic

Для Anthropic как компании Opus 4.6 — это стратегический продукт. Компания позиционирует себя как лидера в области безопасности AI и «вдумчивого» подхода к развитию. Opus 4.6 усиливает это позиционирование: модель не только мощная, но и аккуратная. По данным Anthropic, она реже галлюцинирует на длинных контекстах, чем предыдущие версии, и лучше справляется с инструкциями о формате вывода.

Что дальше? Дарио Амодеи, CEO Anthropic, в нескольких интервью говорил, что контекстное окно будет расти и дальше — до десятков миллионов токенов в ближайшие год-два. Если это произойдёт, мы перейдём к модели, которая может «прочитать» всю документацию крупной корпорации или весь архив научного журнала за десятилетия. Это другой класс инструментов — уже не «умный помощник», а «вторая память» организации.

Какие задачи вы бы хотели решать с AI, который может одновременно видеть миллион токенов контекста — и какие из них вам пока недоступны?

Читайте также: «GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro: кто лучший в 2026 году» — /insights/gpt-5-4-vs-claude-opus-4-6-vs-gemini-3-1-pro-kto-luchshiy-2026. «110 миллиардов за мечту: что стоит за рекордным раундом OpenAI» — /insights/openai-110b-round-730b-valuation

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Анализ

Поделиться:Telegram X LinkedIn

Как вам материал?

600 инженеров Google против Пентагона: письмо не остановит контракт

600 сотрудников Google подписали письмо против Gemini в военных сетях — повторение Project Maven, но с другим исходом.

2026-05-04·1 мин

AI·Аналитика

IBM: 64% CEO принимают стратегические решения на основе AI

Исследование IBM: 64% CEO глобальных компаний уже принимают стратегические решения на основе AI — не изучают, не тестируют, а принимают.

2026-05-04·1 мин

AI·Ежедневный обзор

Daily Digest — 4 мая 2026

В дневнике написано «тогда это была ложь» — и суд сделал это доказательством. Европа узнала, что инструмент, способный взломать любую систему в мире, ей недоступен. Blackstone вывела серверы на биржу. Один день — три истории о том, кто теперь решает, кому достаётся AI.

2026-05-04·6 мин