Как начать пользоваться SubQ 1M -- первый субквадратичный LLM с 12-миллионным контекстом
SubQ 1M -- принципиально новая архитектура языковых моделей, которая в 1000 раз эффективнее трансформеров на длинных контекстах. Разбираем, что это означает на практике и как получить доступ.
Что это и для кого
SubQ 1M -- это языковая модель нового поколения от Miami-стартапа Subquadratic, запущенная 5 мая 2026 года. Её принципиальное отличие от всех существующих LLM -- архитектура, которая масштабируется линейно с ростом контекста, а не квадратично, как у трансформеров.
Чтобы понять, почему это важно, нужно немного разобраться в проблеме. Все современные крупные языковые модели -- GPT, Claude, Gemini, Llama -- основаны на архитектуре трансформера с механизмом attention (внимания). Этот механизм работает так: для обработки каждого нового токена модель должна сравнить его со всеми предыдущими токенами в контексте. Если у вас контекст из 1000 токенов -- это 1 миллион операций сравнения. Контекст из 10 000 токенов -- это уже 100 миллионов операций. Это называется квадратичной сложностью: при удвоении длины контекста вычислительные затраты возрастают вчетверо.
Subquadratic разработала архитектуру SSA (Subquadratic Sparse Attention), где вычислительные затраты растут линейно: удвоение контекста требует лишь удвоения вычислений. Компания заявляет о 52-кратном ускорении prefill-фазы при контексте в 1 миллион токенов по сравнению с FlashAttention -- лучшей реализацией стандартного трансформерного attention.
Кому это нужно прямо сейчас:
- Юристам и аналитикам, которым нужно обрабатывать многотомные договоры, кейсы или отчёты целиком, без «нарезки» документов
- Разработчикам, анализирующим большие кодовые базы: 1 миллион токенов -- это примерно 750 000 слов или несколько крупных репозиториев
- Исследователям, работающим с длинными научными корпусами, архивами переписки или историческими данными
- Всем, кто сталкивался с «потерей памяти» у обычных LLM при работе с длинными документами
- Разработчикам AI-продуктов, которым нужна модель с реально длинным контекстом для production-среды
Важная оговорка: на момент написания SubQ 1M находится в закрытой бета-версии (private beta). Доступ предоставляется по заявке, и не всем немедленно. Кроме того, в сообществе существует скептицизм: полный технический отчёт компания не опубликовала, веса модели закрыты. Независимая проверка заявленных характеристик пока не проводилась.
Как зарегистрироваться / установить
SubQ 1M -- облачная модель. Локальная установка на личный компьютер невозможна: модель не выложена в открытый доступ, веса закрыты. Для работы с ней нужен интернет и одобренный аккаунт.
Шаг 1: Запрос доступа
- Перейдите на сайт subq.ai.
- Найдите кнопку Request Access или Sign Up for Beta.
- Заполните форму: имя, email, компания или проект, описание вашего use case (для чего планируете использовать модель).
- Укажите конкретный сценарий -- это увеличивает шансы на быстрое одобрение. «Хочу попробовать» работает хуже, чем «Мне нужно анализировать договоры объёмом 300+ страниц ежедневно».
- Ожидайте email с подтверждением. Срок ожидания на момент написания -- от нескольких дней до нескольких недель, в зависимости от очереди.
После получения доступа вам откроются три продукта на базе SubQ 1M:
- SubQ API (private beta) -- REST API для интеграции в ваши приложения. Документация в стандартном OpenAI-совместимом формате.
- SubQ Code -- CLI-агент для работы с кодом прямо в терминале. Аналог Claude Code или Codex CLI, но работающий через модель SubQ с контекстом до 1M токенов.
- SubQ Search -- веб-интерфейс для исследований с длинным контекстом: загружаете документы, задаёте вопросы.
Шаг 2: Настройка API (для разработчиков)
- В личном кабинете создайте API-ключ.
- Установите Python-библиотеку: pip install subq или используйте стандартный OpenAI-совместимый клиент с изменённым base_url.
- Задайте переменную окружения: export SUBQ_API_KEY=your_key_here
- Первый тест: попробуйте отправить запрос с большим документом -- именно в этом сценарии SubQ показывает своё преимущество.
Шаг 3: SubQ Code (для разработчиков)
- Установите CLI-агент: pip install subq-code или следуйте инструкциям в документации на subq.ai.
- Аутентифицируйтесь: subq auth login
- Запустите агента в директории вашего проекта: subq code
- Агент проанализирует весь репозиторий целиком (в рамках 1M-токенного контекста) и ответит на вопросы о коде.
Первый запуск -- что попробовать
Ключевое отличие SubQ от обычных LLM становится очевидным только при работе с по-настоящему длинными документами. Если вы тестируете модель на коротких запросах -- вы не увидите разницы. Вот сценарии, которые раскроют реальный потенциал.
Сценарий 1: Анализ длинного документа без «нарезки». Возьмите PDF или текстовый файл объёмом 100+ страниц -- большой договор, научный отчёт, книгу. Загрузите весь документ в контекст SubQ одним запросом и задайте конкретный вопрос: «Какие обязательства принимает сторона А по разделу 4?» или «Сравни подходы к X в главах 3 и 7». Обычные LLM при этом либо «забывают» начало документа, либо требуют разбивки на части. SubQ держит весь документ в памяти.
Сценарий 2: SubQ Code на реальном репозитории. Запустите subq code в директории среднего по размеру проекта (например, open-source репозитория с GitHub). Попросите агента: «Найди все места в коде, где нет обработки ошибок» или «Опиши архитектуру этого проекта целиком». Агент обработает весь репозиторий сразу, без необходимости вручную указывать файлы.
Сценарий 3: SubQ Search для исследовательского анализа. Загрузите в SubQ Search набор научных статей или новостных архивов по одной теме. Задайте аналитический вопрос, требующий синтеза информации из множества источников: «Как менялось мнение экспертов о X за последние 5 лет?». Обычные RAG-системы при этом теряют нюансы -- SubQ читает все документы целиком.
Сценарий 4: Работа с кодовой базой через API. Если у вас есть программный проект, напишите скрипт, который читает все файлы .py или .js из вашего проекта, конкатенирует их в один большой текст и отправляет в SubQ API с запросом об архитектурных проблемах или точках для рефакторинга. 1M токенов -- это около 750 000 слов, что покрывает большинство реальных проектов целиком.
Что проверить при первом тесте: время ответа на длинный контекст. Компания заявляет о значительном ускорении по сравнению с FlashAttention. В реальном использовании prefill (обработка входного контекста) должен занимать разумное время даже при контексте в сотни тысяч токенов.
Ключевые фишки
Субквадратичная архитектура SSA (Subquadratic Sparse Attention). Главное техническое нововведение SubQ -- полностью субквадратичный механизм разреженного внимания. Вместо того чтобы при каждом новом токене обращаться ко всем предыдущим, SSA использует интеллектуальную выборку: модель определяет, какие части контекста действительно важны для текущего шага, и обращается только к ним. Это не просто оптимизация существующего трансформера -- это принципиально иная математика обработки последовательностей.
1M токенов в production-API, 12M в исследовательской версии. SubQ 1M-Preview (production API) имеет контекстное окно в 1 миллион токенов. Исследовательская версия модели, о которой компания рассказывала на закрытых презентациях, демонстрирует контекст до 12 миллионов токенов. Для сравнения: Claude 4.5 имеет 200K токенов, Gemini 3.5 Flash -- 1M токенов, но с квадратичной стоимостью обработки.
SWE-Bench Verified: 81.8%. Компания публикует результат 81.8% на SWE-Bench Verified -- стандартном тесте способности модели исправлять реальные баги в open-source проектах. Это высокий показатель, соответствующий уровню лучших coding-моделей. Однако следует учитывать, что независимая проверка этого результата пока не проводилась.
52-кратное ускорение prefill при 1M токенов. Компания заявляет 52x speedup на фазе prefill (первоначальная обработка входного контекста) по сравнению с FlashAttention при контексте в 1 миллион токенов, и 63% экономию вычислительных ресурсов. Если эти данные подтвердятся независимыми тестами, это означает не только более быстрый ответ, но и принципиально другую структуру затрат на обслуживание длинных контекстов.
Три продукта в одном. SubQ -- не просто API. Компания запустила экосистему из трёх продуктов: API для разработчиков, SubQ Code как альтернативу Claude Code / Codex CLI, и SubQ Search как инструмент для длинноконтекстного исследовательского анализа. Это говорит о том, что Subquadratic думает не только о технологии, но и о конечных пользовательских сценариях.
Команда с опытным техническим бэкграундом. CTO Александр Уэдон ранее работал в Meta и возглавлял направление Generative AI в TribeAI. CEO Джастин Дэнджел -- серийный предприниматель. $29M seed-раунд при оценке около $500M -- серьёзный сигнал доверия со стороны профессиональных инвесторов.
Цены и ограничения
На момент написания SubQ 1M находится в закрытой бета-версии. Публичного прайслиста нет. Стоимость API-доступа не раскрывается до выхода из beta.
Что известно о планах монетизации: компания планирует модель pay-per-token (оплата за токены), аналогично Anthropic и OpenAI. Учитывая заявленную эффективность архитектуры, Subquadratic может предложить цены ниже рыночных для длинноконтекстных запросов -- именно там их технология даёт максимальное преимущество по стоимости вычислений.
Доступные продукты в beta и их статус:
- SubQ API -- private beta, доступ по заявке, цена не раскрыта
- SubQ Code -- private beta, доступ через API-ключ
- SubQ Search -- private beta, доступ по заявке
Важные ограничения, которые нужно учитывать:
- Полный технический отчёт (research paper) на момент написания не опубликован. Заявленные характеристики не прошли независимую верификацию.
- Веса модели закрыты -- нет возможности локального запуска или независимого аудита.
- Закрытый beta означает нестабильное время ожидания доступа -- от дней до недель.
- Сервис новый: надёжность, SLA (Service Level Agreement) и механизмы поддержки ещё формируются.
- Pricing неизвестен: возможно, что когда модель выйдет из beta, цены окажутся выше ожиданий.
Наш совет: подайте заявку на доступ сейчас (это бесплатно), чтобы войти в очередь. Если архитектурные заявления компании подтвердятся независимыми тестами -- SubQ может стать важным инструментом для работы с длинными контекстами. Если нет -- вы ничего не теряете, просто не получив доступа.
Нужен ли VPN из России
SubQ -- американский стартап из Майами. Большинство американских AI-компаний не блокируют доступ к информационным страницам своих сайтов для российских IP-адресов, но часто ограничивают регистрацию и доступ к сервисам.
Ситуация на момент написания: сайт subq.ai открывается из России без VPN. Форма запроса доступа формально доступна. Однако есть несколько нюансов, которые нужно учитывать.
Потенциальная проблема 1: географическая дискриминация при отборе beta-пользователей. Стартапы на ранней стадии нередко приоритизируют пользователей из США и Западной Европы для первых beta-волн -- не из-за политики, а из-за простоты поддержки и юридической чистоты в рамках compliance. Российский адрес в форме заявки может отодвинуть вас в очередь.
Потенциальная проблема 2: оплата. Когда SubQ выйдет из free beta и введёт платный доступ, российские банковские карты с высокой вероятностью не будут приняты. Для оплаты потребуется карта иностранного банка или криптовалюта (если будет поддерживаться).
Потенциальная проблема 3: санкционный compliance. Американские компании, работающие с технологиями двойного назначения (а AI-модели относятся к этой категории), обязаны соблюдать экспортный контроль США (EAR, Export Administration Regulations). Это не означает автоматического запрета для российских пользователей, но compliance-команда стартапа может ограничить доступ из России на определённом этапе.
Практические рекомендации:
- Подайте заявку с реальным описанием вашего use case -- это важнее гео
- Если хотите ускорить получение доступа -- укажите профессиональный контекст (компания, должность, конкретный проект)
- VPN при регистрации и тестировании может помочь обойти потенциальную географическую фильтрацию, но не гарантирует ускорения
- Для оплаты готовьте карту нероссийского банка заранее
Итог: SubQ -- технически интересная модель с необычной архитектурой и большим потенциалом. Из России доступ получить реально, но придётся потерпеть в очереди и решить вопрос с оплатой.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Как начать пользоваться HappyHorse 1.0 -- ИИ-генератор видео номер один от Alibaba
HappyHorse 1.0 -- первая модель, которая генерирует видео и звук одновременно. Разбираем, как начать, что пробовать первым, и есть ли смысл платить.
Как начать пользоваться Qwen3-Coder -- мощнейшая open-source модель для программирования от Alibaba
Qwen3-Coder -- это 480-миллиардная MoE-модель от Alibaba, специально обученная на коде. Она бесплатна, работает через Ollama и превосходит Claude 4.5 Opus в тестах по кодированию. Разбираем, как начать.
Grok 4.3: как начать пользоваться новым флагманом xAI
Полный гайд по Grok 4.3 от xAI: регистрация, Heavy mode с 16 агентами, видеовход, генерация слайдов, цены и доступ из России