Как начать пользоваться SubQ 1M -- первый субквадратичный LLM с 12-миллионным контекстом

SubQ 1M -- принципиально новая архитектура языковых моделей, которая в 1000 раз эффективнее трансформеров на длинных контекстах. Разбираем, что это означает на практике и как получить доступ.

2026-05-30·8 мин

Что это и для кого

SubQ 1M-Preview -- это языковая модель нового поколения от Miami-стартапа Subquadratic, запущенная в public preview 5 мая 2026 года. Суффикс "Preview" в официальном названии указывает на статус продукта: это не финальный релиз, а ранняя версия для тестирования. Архитектурно модель поддерживает до 12 миллионов токенов контекста, однако текущий production-лимит -- 1 миллион токенов. Принципиальное отличие от всех существующих LLM -- архитектура с субквадратичной сложностью (O(n log n)) масштабирования с ростом контекста, в отличие от квадратичного O(n^2) у стандартных трансформеров.

Чтобы понять, почему это важно, нужно немного разобраться в проблеме. Все современные крупные языковые модели -- GPT, Claude, Gemini, Llama -- основаны на архитектуре трансформера с механизмом attention (внимания). Этот механизм работает так: для обработки каждого нового токена модель должна сравнить его со всеми предыдущими токенами в контексте. Если у вас контекст из 1000 токенов -- это 1 миллион операций сравнения. Контекст из 10 000 токенов -- это уже 100 миллионов операций. Это называется квадратичной сложностью: при удвоении длины контекста вычислительные затраты возрастают вчетверо.

Subquadratic разработала архитектуру SSA (Subquadratic Sparse Attention), где вычислительные затраты растут субквадратично (O(n log n)), а не квадратично: при удвоении контекста вычислительные затраты увеличиваются примерно в 2 раза, а не в 4, как у стандартных трансформеров. Компания заявляет о 52-кратном ускорении prefill-фазы при контексте в 1 миллион токенов по сравнению с FlashAttention -- лучшей реализацией стандартного трансформерного attention.

Кому это нужно прямо сейчас:

Юристам и аналитикам, которым нужно обрабатывать многотомные договоры, кейсы или отчёты целиком, без «нарезки» документов
Разработчикам, анализирующим большие кодовые базы: 1 миллион токенов -- это примерно 750 000 слов или несколько крупных репозиториев
Исследователям, работающим с длинными научными корпусами, архивами переписки или историческими данными
Всем, кто сталкивался с «потерей памяти» у обычных LLM при работе с длинными документами
Разработчикам AI-продуктов, которым нужна модель с реально длинным контекстом для production-среды

Важная оговорка: на момент написания SubQ 1M находится в закрытой бета-версии (private beta). Доступ предоставляется по заявке, и не всем немедленно. Кроме того, в сообществе существует скептицизм: полный технический отчёт компания не опубликовала, веса модели закрыты. Независимая проверка заявленных характеристик пока не проводилась.

Как зарегистрироваться / установить

SubQ 1M -- облачная модель. Локальная установка на личный компьютер невозможна: модель не выложена в открытый доступ, веса закрыты. Для работы с ней нужен интернет и одобренный аккаунт.

Шаг 1: Запрос доступа

Перейдите на сайт subq.ai.
Найдите кнопку Request Access или Sign Up for Beta.
Заполните форму: имя, email, компания или проект, описание вашего use case (для чего планируете использовать модель).
Укажите конкретный сценарий -- это увеличивает шансы на быстрое одобрение. «Хочу попробовать» работает хуже, чем «Мне нужно анализировать договоры объёмом 300+ страниц ежедневно».
Ожидайте email с подтверждением. Срок ожидания на момент написания -- от нескольких дней до нескольких недель, в зависимости от очереди.

После получения доступа вам откроются три продукта на базе SubQ 1M:

SubQ API (private beta) -- REST API для интеграции в ваши приложения. Документация в стандартном OpenAI-совместимом формате.
SubQ Code -- CLI-агент для работы с кодом прямо в терминале. Аналог Claude Code или Codex CLI, но работающий через модель SubQ с контекстом до 1M токенов.
SubQ Search -- веб-интерфейс для исследований с длинным контекстом: загружаете документы, задаёте вопросы.

Шаг 2: Настройка API (для разработчиков)

В личном кабинете создайте API-ключ.
Установите Python-библиотеку: pip install subq или используйте стандартный OpenAI-совместимый клиент с изменённым base_url.
Задайте переменную окружения: export SUBQ_API_KEY=your_key_here
Первый тест: попробуйте отправить запрос с большим документом -- именно в этом сценарии SubQ показывает своё преимущество.

Шаг 3: SubQ Code (для разработчиков)

Установите CLI-агент: pip install subq-code или следуйте инструкциям в документации на subq.ai.
Аутентифицируйтесь: subq auth login
Запустите агента в директории вашего проекта: subq code
Агент проанализирует весь репозиторий целиком (в рамках 1M-токенного контекста) и ответит на вопросы о коде.

Первый запуск -- что попробовать

Ключевое отличие SubQ от обычных LLM становится очевидным только при работе с по-настоящему длинными документами. Если вы тестируете модель на коротких запросах -- вы не увидите разницы. Вот сценарии, которые раскроют реальный потенциал.

Сценарий 1: Анализ длинного документа без «нарезки». Возьмите PDF или текстовый файл объёмом 100+ страниц -- большой договор, научный отчёт, книгу. Загрузите весь документ в контекст SubQ одним запросом и задайте конкретный вопрос: «Какие обязательства принимает сторона А по разделу 4?» или «Сравни подходы к X в главах 3 и 7». Обычные LLM при этом либо «забывают» начало документа, либо требуют разбивки на части. SubQ держит весь документ в памяти.

Сценарий 2: SubQ Code на реальном репозитории. Запустите subq code в директории среднего по размеру проекта (например, open-source репозитория с GitHub). Попросите агента: «Найди все места в коде, где нет обработки ошибок» или «Опиши архитектуру этого проекта целиком». Агент обработает весь репозиторий сразу, без необходимости вручную указывать файлы.

Сценарий 3: SubQ Search для исследовательского анализа. Загрузите в SubQ Search набор научных статей или новостных архивов по одной теме. Задайте аналитический вопрос, требующий синтеза информации из множества источников: «Как менялось мнение экспертов о X за последние 5 лет?». Обычные RAG-системы при этом теряют нюансы -- SubQ читает все документы целиком.

Сценарий 4: Работа с кодовой базой через API. Если у вас есть программный проект, напишите скрипт, который читает все файлы .py или .js из вашего проекта, конкатенирует их в один большой текст и отправляет в SubQ API с запросом об архитектурных проблемах или точках для рефакторинга. 1M токенов -- это около 750 000 слов, что покрывает большинство реальных проектов целиком.

Что проверить при первом тесте: время ответа на длинный контекст. Компания заявляет о значительном ускорении по сравнению с FlashAttention. В реальном использовании prefill (обработка входного контекста) должен занимать разумное время даже при контексте в сотни тысяч токенов.

Ключевые фишки

Субквадратичная архитектура SSA (Subquadratic Sparse Attention). Главное техническое нововведение SubQ -- полностью субквадратичный механизм разреженного внимания. Вместо того чтобы при каждом новом токене обращаться ко всем предыдущим, SSA использует интеллектуальную выборку: модель определяет, какие части контекста действительно важны для текущего шага, и обращается только к ним. Это не просто оптимизация существующего трансформера -- это принципиально иная математика обработки последовательностей.

1M токенов в production-API, 12M в исследовательской версии. SubQ 1M-Preview (production API) имеет контекстное окно в 1 миллион токенов. Исследовательская версия модели демонстрирует контекст до 12 миллионов токенов. Для Enterprise-конфигурации через прямое соглашение с Subquadratic доступна версия с поддержкой контекста до 12 миллионов токенов - это практически применимо для анализа крупных кодовых баз, обширных юридических архивов или многолетних деловых переписок целиком. Для сравнения: Claude 4.5 имеет 200K токенов, Gemini 3.5 Flash -- 1M токенов, но с квадратичной стоимостью обработки.

SWE-Bench Verified: 81.8%. Компания публикует результат 81.8% на SWE-Bench Verified -- стандартном тесте способности модели исправлять реальные баги в open-source проектах. Это высокий показатель, соответствующий уровню лучших coding-моделей. Дополнительный бенчмарк: RULER@128K -- 95%, что является одним из лучших показателей по способности модели удерживать и извлекать информацию в середине длинного контекста (задача «needle in a haystack» в масштабе 128K токенов). Однако следует учитывать, что независимая проверка этих результатов пока не проводилась.

52-кратное ускорение prefill при 1M токенов. Компания заявляет 52x speedup на фазе prefill (первоначальная обработка входного контекста) по сравнению с FlashAttention при контексте в 1 миллион токенов, и 63% экономию вычислительных ресурсов. Если эти данные подтвердятся независимыми тестами, это означает не только более быстрый ответ, но и принципиально другую структуру затрат на обслуживание длинных контекстов.

Три продукта в одном. SubQ -- не просто API. Компания запустила экосистему из трёх продуктов: API для разработчиков, SubQ Code как альтернативу Claude Code / Codex CLI, и SubQ Search как инструмент для длинноконтекстного исследовательского анализа. Это говорит о том, что Subquadratic думает не только о технологии, но и о конечных пользовательских сценариях.

Команда с опытным техническим бэкграундом. CTO Александр Уэдон ранее работал в Meta GenAI (подразделение генеративного AI Meta) и возглавлял направление Generative AI в TribeAI. CEO Джастин Дэнджел -- серийный предприниматель. $29M seed-раунд при оценке около $500M -- серьёзный сигнал доверия со стороны профессиональных инвесторов.

Цены и ограничения

На момент написания SubQ 1M находится в закрытой бета-версии. Публичного прайслиста нет. Стоимость API-доступа не раскрывается до выхода из beta.

Что известно о планах монетизации: компания планирует модель pay-per-token (оплата за токены), аналогично Anthropic и OpenAI. Учитывая заявленную эффективность архитектуры, Subquadratic может предложить цены ниже рыночных для длинноконтекстных запросов -- именно там их технология даёт максимальное преимущество по стоимости вычислений.

Доступные продукты в beta и их статус:

SubQ API -- private beta, доступ по заявке, цена не раскрыта
SubQ Code -- private beta, доступ через API-ключ
SubQ Search -- private beta, доступ по заявке

Важные ограничения, которые нужно учитывать:

Полный технический отчёт (research paper) на момент написания не опубликован. Заявленные характеристики не прошли независимую верификацию.
Веса модели закрыты -- нет возможности локального запуска или независимого аудита.
Закрытый beta означает нестабильное время ожидания доступа -- от дней до недель.
Сервис новый: надёжность, SLA (Service Level Agreement) и механизмы поддержки ещё формируются.
Pricing неизвестен: возможно, что когда модель выйдет из beta, цены окажутся выше ожиданий.

Наш совет: подайте заявку на доступ сейчас (это бесплатно), чтобы войти в очередь. Если архитектурные заявления компании подтвердятся независимыми тестами -- SubQ может стать важным инструментом для работы с длинными контекстами. Если нет -- вы ничего не теряете, просто не получив доступа.

Нужен ли VPN из России

SubQ -- американский стартап из Майами. Большинство американских AI-компаний не блокируют доступ к информационным страницам своих сайтов для российских IP-адресов, но часто ограничивают регистрацию и доступ к сервисам.

Ситуация на момент написания: сайт subq.ai открывается из России без VPN. Форма запроса доступа формально доступна. Однако есть несколько нюансов, которые нужно учитывать.

Потенциальная проблема 1: географическая дискриминация при отборе beta-пользователей. Стартапы на ранней стадии нередко приоритизируют пользователей из США и Западной Европы для первых beta-волн -- не из-за политики, а из-за простоты поддержки и юридической чистоты в рамках compliance. Российский адрес в форме заявки может отодвинуть вас в очередь.

Потенциальная проблема 2: оплата. Когда SubQ выйдет из free beta и введёт платный доступ, российские банковские карты с высокой вероятностью не будут приняты. Для оплаты потребуется карта иностранного банка или криптовалюта (если будет поддерживаться).

Потенциальная проблема 3: санкционный compliance. Американские компании, работающие с технологиями двойного назначения (а AI-модели относятся к этой категории), обязаны соблюдать экспортный контроль США (EAR, Export Administration Regulations). Это не означает автоматического запрета для российских пользователей, но compliance-команда стартапа может ограничить доступ из России на определённом этапе.

Практические рекомендации:

Подайте заявку с реальным описанием вашего use case -- это важнее гео
Если хотите ускорить получение доступа -- укажите профессиональный контекст (компания, должность, конкретный проект)
VPN при регистрации и тестировании может помочь обойти потенциальную географическую фильтрацию, но не гарантирует ускорения
Для оплаты готовьте карту нероссийского банка заранее

Итог: SubQ -- технически интересная модель с необычной архитектурой и большим потенциалом. Из России доступ получить реально, но придётся потерпеть в очереди и решить вопрос с оплатой.

Обновление: июль 2026

В июне 2026 года SubQ AI выпустила SubQ 1.1 Small -- вторую итерацию архитектуры SSA (Sub-Quadratic Attention). Модель работает с теми же объёмами контекста, что и SubQ 1M, но оптимизирована для работы с ограниченными вычислительными ресурсами. SubQ 1.1 Small доступна избранным партнёрам по дизайну (design partners). На 2026 год компания анонсировала линейку моделей с контекстным окном от 2M до 12M токенов.

Статус продуктов SubQ в private beta (июль 2026). По состоянию на июль 2026 года все три продукта SubQ остаются в private beta: SubQ API (developer access, REST API с OpenAI-совместимым интерфейсом), SubQ Code (CLI-агент для долгосрочного кодирования с поддержкой больших репозиториев) и SubQ Search (инструмент поиска с 1M контекстом, бесплатный в рамках beta). Доступ предоставляется по заявке на subq.ai.

SWE-Bench Verified: 81,8%. Компания Subquadratic публикует результат 81,8% на бенчмарке SWE-Bench Verified - стандартном тесте способности модели исправлять реальные баги в GitHub-репозиториях. Это один из наиболее высоких опубликованных показателей среди специализированных кодинговых моделей на момент написания. Независимая верификация результата не проводилась - полный технический отчёт компания планирует опубликовать после выхода из beta.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:llm subq subquadratic context-window new-architecture

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Как начать пользоваться Agno: Python-фреймворк для создания AI-агентов

Agno (бывший phidata) - один из самых популярных Python-фреймворков для построения AI-агентов с 39k+ звезд на GitHub. Пошаговый гайд: установка, первый агент за 5 минут, мультиагентные команды и деплой в продакшн.

2026-07-14·8 мин

С чего начать·Гайд

Seedance 2.5: как начать пользоваться генератором видео от ByteDance

Seedance 2.5 от ByteDance генерирует нативное 30-секундное видео в один проход, принимает до 50 мультимодальных референсов и позволяет редактировать отдельные фрагменты без перегенерации всего клипа.

2026-07-13·7 мин

С чего начать·Гайд

ChatGPT Work: как начать пользоваться агентным рабочим столом OpenAI

9 июля 2026 OpenAI запустила ChatGPT Work -- агента, который берёт у вас целый проект, сам планирует шаги, работает часами в фоне и возвращает готовый документ, таблицу или презентацию.

2026-07-13·8 мин