Как начать пользоваться SubQ 1M -- первый субквадратичный LLM с 12-миллионным контекстом

SubQ 1M -- принципиально новая архитектура языковых моделей, которая в 1000 раз эффективнее трансформеров на длинных контекстах. Разбираем, что это означает на практике и как получить доступ.

·8 мин

Что это и для кого

SubQ 1M -- это языковая модель нового поколения от Miami-стартапа Subquadratic, запущенная 5 мая 2026 года. Её принципиальное отличие от всех существующих LLM -- архитектура, которая масштабируется линейно с ростом контекста, а не квадратично, как у трансформеров.

Чтобы понять, почему это важно, нужно немного разобраться в проблеме. Все современные крупные языковые модели -- GPT, Claude, Gemini, Llama -- основаны на архитектуре трансформера с механизмом attention (внимания). Этот механизм работает так: для обработки каждого нового токена модель должна сравнить его со всеми предыдущими токенами в контексте. Если у вас контекст из 1000 токенов -- это 1 миллион операций сравнения. Контекст из 10 000 токенов -- это уже 100 миллионов операций. Это называется квадратичной сложностью: при удвоении длины контекста вычислительные затраты возрастают вчетверо.

Subquadratic разработала архитектуру SSA (Subquadratic Sparse Attention), где вычислительные затраты растут линейно: удвоение контекста требует лишь удвоения вычислений. Компания заявляет о 52-кратном ускорении prefill-фазы при контексте в 1 миллион токенов по сравнению с FlashAttention -- лучшей реализацией стандартного трансформерного attention.

Кому это нужно прямо сейчас:

  • Юристам и аналитикам, которым нужно обрабатывать многотомные договоры, кейсы или отчёты целиком, без «нарезки» документов
  • Разработчикам, анализирующим большие кодовые базы: 1 миллион токенов -- это примерно 750 000 слов или несколько крупных репозиториев
  • Исследователям, работающим с длинными научными корпусами, архивами переписки или историческими данными
  • Всем, кто сталкивался с «потерей памяти» у обычных LLM при работе с длинными документами
  • Разработчикам AI-продуктов, которым нужна модель с реально длинным контекстом для production-среды

Важная оговорка: на момент написания SubQ 1M находится в закрытой бета-версии (private beta). Доступ предоставляется по заявке, и не всем немедленно. Кроме того, в сообществе существует скептицизм: полный технический отчёт компания не опубликовала, веса модели закрыты. Независимая проверка заявленных характеристик пока не проводилась.

Как зарегистрироваться / установить

SubQ 1M -- облачная модель. Локальная установка на личный компьютер невозможна: модель не выложена в открытый доступ, веса закрыты. Для работы с ней нужен интернет и одобренный аккаунт.

Шаг 1: Запрос доступа

  1. Перейдите на сайт subq.ai.
  2. Найдите кнопку Request Access или Sign Up for Beta.
  3. Заполните форму: имя, email, компания или проект, описание вашего use case (для чего планируете использовать модель).
  4. Укажите конкретный сценарий -- это увеличивает шансы на быстрое одобрение. «Хочу попробовать» работает хуже, чем «Мне нужно анализировать договоры объёмом 300+ страниц ежедневно».
  5. Ожидайте email с подтверждением. Срок ожидания на момент написания -- от нескольких дней до нескольких недель, в зависимости от очереди.

После получения доступа вам откроются три продукта на базе SubQ 1M:

  • SubQ API (private beta) -- REST API для интеграции в ваши приложения. Документация в стандартном OpenAI-совместимом формате.
  • SubQ Code -- CLI-агент для работы с кодом прямо в терминале. Аналог Claude Code или Codex CLI, но работающий через модель SubQ с контекстом до 1M токенов.
  • SubQ Search -- веб-интерфейс для исследований с длинным контекстом: загружаете документы, задаёте вопросы.

Шаг 2: Настройка API (для разработчиков)

  1. В личном кабинете создайте API-ключ.
  2. Установите Python-библиотеку: pip install subq или используйте стандартный OpenAI-совместимый клиент с изменённым base_url.
  3. Задайте переменную окружения: export SUBQ_API_KEY=your_key_here
  4. Первый тест: попробуйте отправить запрос с большим документом -- именно в этом сценарии SubQ показывает своё преимущество.

Шаг 3: SubQ Code (для разработчиков)

  1. Установите CLI-агент: pip install subq-code или следуйте инструкциям в документации на subq.ai.
  2. Аутентифицируйтесь: subq auth login
  3. Запустите агента в директории вашего проекта: subq code
  4. Агент проанализирует весь репозиторий целиком (в рамках 1M-токенного контекста) и ответит на вопросы о коде.

Первый запуск -- что попробовать

Ключевое отличие SubQ от обычных LLM становится очевидным только при работе с по-настоящему длинными документами. Если вы тестируете модель на коротких запросах -- вы не увидите разницы. Вот сценарии, которые раскроют реальный потенциал.

Сценарий 1: Анализ длинного документа без «нарезки». Возьмите PDF или текстовый файл объёмом 100+ страниц -- большой договор, научный отчёт, книгу. Загрузите весь документ в контекст SubQ одним запросом и задайте конкретный вопрос: «Какие обязательства принимает сторона А по разделу 4?» или «Сравни подходы к X в главах 3 и 7». Обычные LLM при этом либо «забывают» начало документа, либо требуют разбивки на части. SubQ держит весь документ в памяти.

Сценарий 2: SubQ Code на реальном репозитории. Запустите subq code в директории среднего по размеру проекта (например, open-source репозитория с GitHub). Попросите агента: «Найди все места в коде, где нет обработки ошибок» или «Опиши архитектуру этого проекта целиком». Агент обработает весь репозиторий сразу, без необходимости вручную указывать файлы.

Сценарий 3: SubQ Search для исследовательского анализа. Загрузите в SubQ Search набор научных статей или новостных архивов по одной теме. Задайте аналитический вопрос, требующий синтеза информации из множества источников: «Как менялось мнение экспертов о X за последние 5 лет?». Обычные RAG-системы при этом теряют нюансы -- SubQ читает все документы целиком.

Сценарий 4: Работа с кодовой базой через API. Если у вас есть программный проект, напишите скрипт, который читает все файлы .py или .js из вашего проекта, конкатенирует их в один большой текст и отправляет в SubQ API с запросом об архитектурных проблемах или точках для рефакторинга. 1M токенов -- это около 750 000 слов, что покрывает большинство реальных проектов целиком.

Что проверить при первом тесте: время ответа на длинный контекст. Компания заявляет о значительном ускорении по сравнению с FlashAttention. В реальном использовании prefill (обработка входного контекста) должен занимать разумное время даже при контексте в сотни тысяч токенов.

Ключевые фишки

Субквадратичная архитектура SSA (Subquadratic Sparse Attention). Главное техническое нововведение SubQ -- полностью субквадратичный механизм разреженного внимания. Вместо того чтобы при каждом новом токене обращаться ко всем предыдущим, SSA использует интеллектуальную выборку: модель определяет, какие части контекста действительно важны для текущего шага, и обращается только к ним. Это не просто оптимизация существующего трансформера -- это принципиально иная математика обработки последовательностей.

1M токенов в production-API, 12M в исследовательской версии. SubQ 1M-Preview (production API) имеет контекстное окно в 1 миллион токенов. Исследовательская версия модели, о которой компания рассказывала на закрытых презентациях, демонстрирует контекст до 12 миллионов токенов. Для сравнения: Claude 4.5 имеет 200K токенов, Gemini 3.5 Flash -- 1M токенов, но с квадратичной стоимостью обработки.

SWE-Bench Verified: 81.8%. Компания публикует результат 81.8% на SWE-Bench Verified -- стандартном тесте способности модели исправлять реальные баги в open-source проектах. Это высокий показатель, соответствующий уровню лучших coding-моделей. Однако следует учитывать, что независимая проверка этого результата пока не проводилась.

52-кратное ускорение prefill при 1M токенов. Компания заявляет 52x speedup на фазе prefill (первоначальная обработка входного контекста) по сравнению с FlashAttention при контексте в 1 миллион токенов, и 63% экономию вычислительных ресурсов. Если эти данные подтвердятся независимыми тестами, это означает не только более быстрый ответ, но и принципиально другую структуру затрат на обслуживание длинных контекстов.

Три продукта в одном. SubQ -- не просто API. Компания запустила экосистему из трёх продуктов: API для разработчиков, SubQ Code как альтернативу Claude Code / Codex CLI, и SubQ Search как инструмент для длинноконтекстного исследовательского анализа. Это говорит о том, что Subquadratic думает не только о технологии, но и о конечных пользовательских сценариях.

Команда с опытным техническим бэкграундом. CTO Александр Уэдон ранее работал в Meta и возглавлял направление Generative AI в TribeAI. CEO Джастин Дэнджел -- серийный предприниматель. $29M seed-раунд при оценке около $500M -- серьёзный сигнал доверия со стороны профессиональных инвесторов.

Цены и ограничения

На момент написания SubQ 1M находится в закрытой бета-версии. Публичного прайслиста нет. Стоимость API-доступа не раскрывается до выхода из beta.

Что известно о планах монетизации: компания планирует модель pay-per-token (оплата за токены), аналогично Anthropic и OpenAI. Учитывая заявленную эффективность архитектуры, Subquadratic может предложить цены ниже рыночных для длинноконтекстных запросов -- именно там их технология даёт максимальное преимущество по стоимости вычислений.

Доступные продукты в beta и их статус:

  • SubQ API -- private beta, доступ по заявке, цена не раскрыта
  • SubQ Code -- private beta, доступ через API-ключ
  • SubQ Search -- private beta, доступ по заявке

Важные ограничения, которые нужно учитывать:

  • Полный технический отчёт (research paper) на момент написания не опубликован. Заявленные характеристики не прошли независимую верификацию.
  • Веса модели закрыты -- нет возможности локального запуска или независимого аудита.
  • Закрытый beta означает нестабильное время ожидания доступа -- от дней до недель.
  • Сервис новый: надёжность, SLA (Service Level Agreement) и механизмы поддержки ещё формируются.
  • Pricing неизвестен: возможно, что когда модель выйдет из beta, цены окажутся выше ожиданий.

Наш совет: подайте заявку на доступ сейчас (это бесплатно), чтобы войти в очередь. Если архитектурные заявления компании подтвердятся независимыми тестами -- SubQ может стать важным инструментом для работы с длинными контекстами. Если нет -- вы ничего не теряете, просто не получив доступа.

Нужен ли VPN из России

SubQ -- американский стартап из Майами. Большинство американских AI-компаний не блокируют доступ к информационным страницам своих сайтов для российских IP-адресов, но часто ограничивают регистрацию и доступ к сервисам.

Ситуация на момент написания: сайт subq.ai открывается из России без VPN. Форма запроса доступа формально доступна. Однако есть несколько нюансов, которые нужно учитывать.

Потенциальная проблема 1: географическая дискриминация при отборе beta-пользователей. Стартапы на ранней стадии нередко приоритизируют пользователей из США и Западной Европы для первых beta-волн -- не из-за политики, а из-за простоты поддержки и юридической чистоты в рамках compliance. Российский адрес в форме заявки может отодвинуть вас в очередь.

Потенциальная проблема 2: оплата. Когда SubQ выйдет из free beta и введёт платный доступ, российские банковские карты с высокой вероятностью не будут приняты. Для оплаты потребуется карта иностранного банка или криптовалюта (если будет поддерживаться).

Потенциальная проблема 3: санкционный compliance. Американские компании, работающие с технологиями двойного назначения (а AI-модели относятся к этой категории), обязаны соблюдать экспортный контроль США (EAR, Export Administration Regulations). Это не означает автоматического запрета для российских пользователей, но compliance-команда стартапа может ограничить доступ из России на определённом этапе.

Практические рекомендации:

  • Подайте заявку с реальным описанием вашего use case -- это важнее гео
  • Если хотите ускорить получение доступа -- укажите профессиональный контекст (компания, должность, конкретный проект)
  • VPN при регистрации и тестировании может помочь обойти потенциальную географическую фильтрацию, но не гарантирует ускорения
  • Для оплаты готовьте карту нероссийского банка заранее

Итог: SubQ -- технически интересная модель с необычной архитектурой и большим потенциалом. Из России доступ получить реально, но придётся потерпеть в очереди и решить вопрос с оплатой.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Как начать пользоваться HappyHorse 1.0 -- ИИ-генератор видео номер один от Alibaba

HappyHorse 1.0 -- первая модель, которая генерирует видео и звук одновременно. Разбираем, как начать, что пробовать первым, и есть ли смысл платить.

·7 мин

Как начать пользоваться Qwen3-Coder -- мощнейшая open-source модель для программирования от Alibaba

Qwen3-Coder -- это 480-миллиардная MoE-модель от Alibaba, специально обученная на коде. Она бесплатна, работает через Ollama и превосходит Claude 4.5 Opus в тестах по кодированию. Разбираем, как начать.

·7 мин

Grok 4.3: как начать пользоваться новым флагманом xAI

Полный гайд по Grok 4.3 от xAI: регистрация, Heavy mode с 16 агентами, видеовход, генерация слайдов, цены и доступ из России

·7 мин