Как начать пользоваться Qwen 3.7 Max: новый флагман Alibaba с триллионом параметров

Полный гайд по Qwen 3.7 Max от Alibaba: что это за модель с 1 триллионом параметров, как получить к ней доступ через DashScope или OpenRouter, режим расширенного мышления и нужен ли VPN из России.

·7 мин

Что это и для кого

20 мая 2026 года Alibaba представила Qwen 3.7 Max на конференции Alibaba Cloud Summit в Ханчжоу. Интересный нюанс: API-доступ был открыт ещё 19 мая -- за сутки до публичного объявления. Этот необычный шаг позволил разработчикам протестировать модель заранее, и к моменту официального анонса в сети уже появились первые независимые обзоры с положительными оценками. Это добавило весомости словам компании на сцене и нетипично выгодно выделило запуск на фоне традиционных маркетинговых анонсов конкурентов.

По техническим характеристикам Qwen 3.7 Max -- закрытая модель с более чем одним триллионом параметров (Alibaba намеренно не называет точное число). Контекстное окно составляет один миллион токенов, что соответствует примерно 750 тысячам слов или объёму трёх-четырёх крупных романов. Такой размер позволяет загружать в модель целые кодовые базы, объёмные корпоративные документы или длинные транскрипты совещаний за один запрос без необходимости разбивать материал на части и управлять состоянием вручную.

Принципиальная особенность модели -- ориентация на агентские задачи. Alibaba обучала Qwen 3.7 Max планировать длинные цепочки действий, стабильно использовать инструменты и сохранять производительность на горизонте от сотен до тысяч последовательных шагов. Компания заявляет, что модель способна работать автономно до 35 часов без деградации качества и поддерживает более 1000 последовательных вызовов инструментов в одной сессии -- это рекордный показатель среди коммерческих LLM на момент запуска. Alibaba также переработала механизм внимания для сохранения точности на хвосте миллионного контекста.

Независимые бенчмарки подтверждают заявленное качество. На Artificial Analysis Intelligence Index Qwen 3.7 Max набрала 57 баллов и вошла в глобальный топ-10 среди всех LLM. На профессиональном тесте SWE-Bench Pro, который измеряет способность автономно решать реальные баги в репозиториях GitHub, модель показала результат выше GPT-5.5 от OpenAI и Gemini 3.5 Flash от Google (рекомендован как дефолтная модель с мая 2026). На Terminal-Bench, оценивающем работу в командной строке, модель заняла первое место среди всех API-only продуктов. Все результаты размещены на независимых публичных платформах.

Целевая аудитория: прежде всего разработчики, строящие агентов и автоматизированные конвейеры, которым нужна модель-оркестратор с долгосрочной стабильностью. Аналитики данных и исследователи получают встроенный режим расширенного мышления, полезный для задач, где важен сам ход рассуждений. Компании, стремящиеся диверсифицировать поставщиков AI за пределами американских корпораций, получают доступ к флагману одной из крупнейших технологических компаний мира. Для простых повседневных задач модель избыточна по стоимости -- лёгкие варианты Qwen 3.5 справятся дешевле.

Важно понять отличие Qwen 3.7 Max от других продуктов Alibaba. На AravanaAI уже описаны: Qwen (ранний чат-ассистент), Qwen 3.5 Omni (мультимодальная модель для работы с голосом и изображениями), Qwen 3.6 27B (компактная open-source версия для локального запуска на потребительском оборудовании) и Qwen3 Coder (специализированная модель для задач программирования). Qwen 3.7 Max -- это не следующая итерация в этих линейках, а принципиально иной флагман, конкурирующий напрямую с GPT-5 и Claude Fable 5 в нише агентских систем.

Полезно также сравнить Qwen 3.7 Max с ближайшими конкурентами на рынке. NVIDIA Nemotron 3 Ultra -- открытая модель сопоставимого качества с разрешительной лицензией, которую можно скачать и запустить самостоятельно. Claude Fable 5 от Anthropic традиционно силён в задачах, требующих точных и безопасных ответов с минимальными галлюцинациями. GPT-5 от OpenAI ориентирован на широкий потребительский рынок. Qwen 3.7 Max занимает нишу мощного агентского оркестратора с длинным контекстом и конкурентной ценой для API-only продукта такого масштаба.

Как зарегистрироваться / установить

Qwen 3.7 Max -- закрытая модель без открытых весов, запустить её локально на собственном оборудовании невозможно. Существует три основных пути доступа: официальный API через Alibaba Cloud DashScope для производственного использования, агрегатор OpenRouter для тех, кто предпочитает единую точку входа или платит криптовалютой, и веб-интерфейс qwen.ai для быстрого знакомства без настройки API. Выбор зависит от технических требований проекта и наличия зарубежной банковской карты.

Самый простой старт -- qwen.ai/chat. Перейдите на сайт и зарегистрируйтесь через адрес электронной почты или существующий аккаунт Google. Никаких ограничений по стране регистрации нет. После входа выберите Qwen 3.7 Max из выпадающего списка доступных моделей в верхней части интерфейса. Система поддерживает загрузку файлов различных форматов (PDF, DOCX, CSV, изображения), переключение режима расширенного мышления одной кнопкой и просмотр внутренних рассуждений модели в отдельном разворачиваемом блоке над ответом. Бесплатен с суточными лимитами на расширенный режим мышления.

Для разработчиков: создайте аккаунт Alibaba Cloud на dashscope.aliyuncs.com. Понадобится действующий адрес электронной почты и номер телефона для SMS-верификации -- российские номера принимаются. После входа в личный кабинет перейдите в раздел API Keys и создайте новый ключ доступа. Запишите ключ сразу -- впоследствии он отображаться не будет. В API модель называется qwen3.7-max. Endpoint полностью совместим с форматом OpenAI: достаточно заменить base_url на https://dashscope.aliyuncs.com/compatible-mode/v1 и api_key. Новые аккаунты получают бесплатные кредиты. Документация на английском: bailian.aliyun.com.

OpenRouter (openrouter.ai): зарегистрируйтесь через почту или аккаунт Google/GitHub. В каталоге найдите модель qwen/qwen-3.7-max. Ключевое преимущество для российских пользователей -- OpenRouter принимает криптовалюту (USDC, ETH, SOL) в качестве способа пополнения баланса. Также доступен единый биллинг для всех моделей из разных провайдеров в одном интерфейсе, что удобно при сравнении нескольких LLM. Минус -- небольшая надбавка к цене по сравнению с прямым DashScope.

Чтобы использовать расширенное мышление через API DashScope, добавьте в тело запроса параметр enable_thinking: true. Дополнительно можно задать thinking_budget -- максимальное число токенов для внутренних рассуждений. Рекомендуемые значения: 2000--4000 токенов для обычных вопросов, 8000--16000 для сложных аналитических задач. При увеличении бюджета растут глубина анализа и время ожидания ответа. В веб-интерфейсе та же функциональность доступна через кнопку Think без написания кода.

Первый запуск -- что попробовать

Откройте qwen.ai/chat и сразу включите режим расширенного мышления -- нажмите кнопку Think в правой части строки ввода. В этом режиме модель перед ответом генерирует внутренний монолог: шаг за шагом разворачивает цепочку рассуждений, сверяет промежуточные выводы с исходным запросом и при необходимости пересматривает принятые решения. Внутренние размышления отображаются в свёрнутом блоке прямо над финальным ответом и их можно раскрыть. Такая прозрачность особенно ценна там, где важно не только получить ответ, но и убедиться в правильности хода мысли.

Для первого теста попробуйте многоступенчатую аналитическую задачу. Например: вставьте данные из таблицы продаж за несколько месяцев и напишите: «Найди аномалии, объясни их возможные причины, предложи план A/B-теста для проверки наиболее вероятной гипотезы». Qwen 3.7 Max удерживает контекст длинного рассуждения без потери нити, принимает промежуточные решения и возвращается к ним при необходимости. В режиме мышления хорошо видно, как модель последовательно оценивает версии и отбрасывает слабые объяснения.

Другой показательный сценарий -- задачи программирования. Опишите баг в коде или попросите спроектировать архитектуру небольшой системы, явно попросив объяснить выбор подхода и рассмотренные альтернативы. В режиме мышления модель проговаривает компромиссы перед написанием кода -- именно такой подход обеспечил первое место на SWE-Bench Pro. Через API передайте список инструментов в параметре tools и попросите агента автономно решить задачу -- это лучший способ оценить агентские возможности модели. Запросы полностью принимаются на русском языке.

Ключевые фишки

Встроенный режим расширенного мышления -- главная отличительная черта Qwen 3.7 Max, которой нет у большинства конкурентов в таком нативном исполнении. Перед финальным ответом модель генерирует внутреннюю цепочку рассуждений, самостоятельно проверяет логику и при необходимости пересматривает промежуточные выводы. В API управляется параметром enable_thinking: true и бюджетом токенов thinking_budget. Чем выше бюджет -- тем глубже анализ и тем выше стоимость. Для большинства задач 4000--8000 токенов обеспечивают хороший баланс. Для сложных исследовательских или математических задач -- 16000 и выше.

Долгосрочная автономность выгодно отличает Qwen 3.7 Max от других LLM. Alibaba заявляет до 35 часов непрерывной работы без деградации качества планирования и поддержку более 1000 последовательных вызовов инструментов в одной сессии. На практике это означает, что агент на базе модели выполняет многошаговые задачи -- от исследования и анализа до написания отчётов -- полностью автономно. Большинство конкурирующих моделей теряют качество уже через несколько десятков шагов, что требует ручного перезапуска и наблюдения.

Технические конкурентные преимущества: OpenAI-совместимый API (замена двух строк кода для интеграции), первые места на SWE-Bench Pro и Terminal-Bench среди API-only моделей, переработанный механизм внимания с реальной точностью на хвосте миллионного контекста. Модель хорошо понимает русский язык для технических и деловых задач, хотя стилистика иногда чуть отличается от носителей. Официальная документация регулярно обновляется, поддерживается на нескольких языках.

Цены и ограничения

На момент написания этого материала доступ через DashScope стоит примерно 1,25 доллара за миллион входящих токенов и 3,75 доллара за миллион исходящих. Это промоционная цена со скидкой 50% от стандартных тарифов (2,50 и 7,50 доллара соответственно). Акционные условия действуют ограниченное время: уточняйте актуальные тарифы на страницах DashScope или OpenRouter перед запуском производственных проектов -- цены могут существенно вырасти после окончания промоции. Бесплатного API-уровня нет. Новые аккаунты Alibaba Cloud получают пробные кредиты на первоначальное тестирование. Через веб-интерфейс qwen.ai/chat модель доступна бесплатно с суточными лимитами на использование расширенного режима мышления.

Ключевые ограничения, которые нужно учитывать. Qwen 3.7 Max -- полностью закрытая модель без открытых весов: нет возможности локального запуска, дообучения на собственных данных или смены провайдера без переписывания кода. Для задач с высокими требованиями к конфиденциальности это критический недостаток: все промпты передаются через серверы Alibaba. Максимальная длина одного ответа в стандартном режиме -- 8192 токена. Для простых повседневных задач модель является избыточной по стоимости -- более лёгкие версии Qwen 3.5 справятся дешевле при сопоставимом качестве на несложных запросах.

Нужен ли VPN из России

Веб-интерфейс qwen.ai доступен из России напрямую на большинстве провайдеров. Регистрация требует только адреса электронной почты, никаких географических ограничений нет. Для первого знакомства с моделью и оценки её возможностей VPN не нужен. DashScope (dashscope.aliyuncs.com) -- продукт Alibaba Cloud, которая как правило не ограничивает доступ из России. SMS-верификация при регистрации принимает российские номера. Оплата DashScope через Visa и Mastercard, карты Мир не принимаются. При отсутствии зарубежной карты используйте OpenRouter с оплатой криптовалютой.

OpenRouter стабильно доступен из России без VPN и принимает криптовалюту (USDC, ETH, SOL). Это наиболее удобный вариант оплаты для российских пользователей без международных банковских карт. Если DashScope окажется недоступен у конкретного провайдера, VPN с европейским сервером (Нидерланды, Германия) или азиатским (Гонконг, Сингапур) решит проблему. Практика показывает, что большинство российских пользователей подключаются к qwen.ai, DashScope и OpenRouter без VPN. Держите его под рукой на всякий случай, но обязательным элементом для работы с Qwen 3.7 Max он не является.

Qwen 3.7-Plus (с 1 июня 2026): Qwen 3.7-Plus стал общедоступным 1 июня 2026 года. В отличие от Max, Plus поддерживает мультимодальный ввод (текст, изображения, видео) и предназначен для задач, требующих анализа визуальных данных. Max остаётся оптимальным выбором для текстовых агентных задач с длинным контекстом, тогда как Plus лучше подходит для мультимедийных и визуальных сценариев. Доступен через qwen.ai и Alibaba Cloud DashScope.

Цена Qwen 3.7 Plus составляет около 1/6 от стоимости Max (на момент написания) -- что делает его привлекательным для мультимодальных задач с большим объёмом запросов.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Как начать пользоваться Vidu: AI-генератор видео из текста и фото

Полный гайд по Vidu -- китайскому AI-сервису для создания видео. Бесплатный тариф, три режима генерации: из текста, из фото и по референсу. Никакой установки -- работает в браузере.

·7 мин

Как начать пользоваться Cline: автономный AI-агент для кода прямо в VS Code

Полный гайд по Cline -- open-source AI-агенту для VS Code с 5 миллионами установок. Работает с любой моделью, редактирует файлы, выполняет команды в терминале, открывает браузер. Apache 2.0, bring-your-own-key.

·7 мин

Как начать пользоваться CodeRabbit: AI-ревью кода прямо в GitHub и GitLab

Гайд по CodeRabbit -- самому популярному AI-инструменту для автоматического ревью кода. 2 миллиона репозиториев, поддержка GitHub, GitLab, Azure DevOps и Bitbucket. Бесплатно для open-source проектов.

·7 мин