Как начать пользоваться Qwen3-Coder -- мощнейшая open-source модель для программирования от Alibaba

Qwen3-Coder -- это 480-миллиардная MoE-модель от Alibaba, специально обученная на коде. Она бесплатна, работает через Ollama и превосходит Claude 4.5 Opus в тестах по кодированию. Разбираем, как начать.

2026-05-30·7 мин

Обновления Qwen Coder (2026)

Qwen3.6-27B (22 апреля 2026, Apache 2.0 лицензия) - открытая модель для кодирования от Alibaba. По результатам бенчмарков превосходит Qwen3.5-397B несмотря на гораздо меньший размер. 27 миллиардов параметров, обучена на 18 триллионах токенов кода, поддерживает 300+ языков программирования. SWE-Bench Verified: 69.6% (обновление июня 2026) -- значительный прогресс по сравнению с исходными 45.8%. Результат сопоставим с ведущими закрытыми моделями.

qwen-code - терминальный агент (аналог Claude Code и OpenCode): устанавливается через npm install -g qwen-code. Использует Qwen3-Coder как базовую модель через Alibaba Cloud API. Поддерживает автономное выполнение задач, редактирование файлов, запуск тестов. Бесплатный trial через qwen.ai.

API Qwen3-Coder через Alibaba Cloud: $0.40/M input токенов, $1.60/M output (значительно дешевле Claude или GPT). Через OpenRouter: выберите qwen/qwen3.6-coder в списке моделей. Совместим с OpenAI API формат - минимальные изменения кода для миграции с GPT.

Локальный запуск Qwen3.6-27B: требуется 32 ГБ VRAM в fp16 или 18 ГБ в INT4 GGUF квантизации. Через Ollama: ollama pull qwen3.6-coder. Через LM Studio: найдите в каталоге 'Qwen3.6-Coder-GGUF'. На Apple Silicon M3 Max (128GB) - полный fp16 через MLX.

Что это и для кого

Обновления Qwen Coder (2026)

Что это и для кого

Qwen3-Coder -- это специализированная языковая модель для программирования от команды Qwen в Alibaba. Полное название: Qwen3-Coder-480B-A35B-Instruct, что расшифровывается так: 480 миллиардов параметров всего, 35 миллиардов активных параметров на каждый токен. Это архитектура MoE -- Mixture of Experts (смесь экспертов), которая позволяет иметь огромную модель, но использовать только часть её возможностей для каждого конкретного запроса.

Главное, что делает Qwen3-Coder особенным: это open-source модель под лицензией Apache 2.0. Это означает, что вы можете скачать её, запустить локально, использовать в коммерческих проектах и даже модифицировать -- бесплатно и без ограничений. При этом по качеству кодинга модель соответствует или превосходит Claude 4.5 Opus на бенчмарке Terminal-Bench 2.0, который измеряет способность модели решать реальные задачи в командной строке.

Контекстное окно -- 256K токенов нативно (расширяемо до 1M), что позволяет анализировать крупные кодовые базы целиком. Поддерживается 119 языков программирования. Встроена поддержка протокола MCP (Model Context Protocol), что упрощает интеграцию с инструментами разработчика.

Кому подойдёт Qwen3-Coder:

Разработчикам, которые хотят мощный AI-помощник по коду без ежемесячной подписки
Командам, которым важна приватность: локальный запуск означает, что код не покидает ваш сервер
Компаниям, которым нужно встроить AI-генерацию кода в собственные продукты (Apache 2.0 разрешает коммерческое использование)
Исследователям и студентам, изучающим возможности AI-кодинга без ограничений API
DevOps и системным администраторам, автоматизирующим задачи через командную строку

Если у вас нет GPU достаточной мощности для запуска полной 480B-модели -- не беспокойтесь. Alibaba выпустила линейку меньших моделей той же серии: 0.6B, 1.7B, 4B, 8B, 30B-A3B (с активными 3B параметрами благодаря MoE) и 32B. Модели 30B-A3B (с активными 3B параметрами благодаря MoE) и 32B запускаются на потребительских GPU или через Ollama на Mac с Apple Silicon и дают отличное соотношение размера и качества.

Как зарегистрироваться / установить

Qwen3-Coder -- open-source модель, и у вас есть несколько способов её использовать. Выбор зависит от ваших технических возможностей и задач.

Способ 1: Ollama (рекомендуем для большинства пользователей)

Ollama -- это инструмент для запуска LLM-моделей локально через простой интерфейс командной строки. Он работает на macOS, Linux и Windows.

Установите Ollama: перейдите на ollama.com и скачайте установщик для вашей ОС. На macOS: скачайте .dmg и перетащите в Applications. На Linux: curl -fsSL https://ollama.com/install.sh | sh
Выберите размер модели. Для Mac с 16 GB RAM рекомендуем 30B-A3B (с активными 3B параметрами благодаря MoE): ollama pull qwen3-coder:14b. Для Mac с 32+ GB RAM: ollama pull qwen3-coder:32b. Для мощных серверных GPU: ollama pull qwen3-coder (полная 480B версия потребует нескольких GPU класса A100).
После скачивания запустите модель: ollama run qwen3-coder:14b
Вы окажетесь в интерактивном чате прямо в терминале. Вставьте фрагмент кода и задайте вопрос.

Способ 2: Qwen Chat (веб-интерфейс, бесплатно)

Перейдите на chat.qwenlm.ai
Зарегистрируйтесь или войдите через Google/GitHub
В выборе модели найдите Qwen3-Coder
Начните работу в браузере без какой-либо установки

Это самый быстрый способ попробовать модель. Бесплатный тариф имеет дневной лимит, но для знакомства его достаточно.

Способ 3: Alibaba Cloud Model Studio API

Зарегистрируйтесь на alibabacloud.com
Перейдите в раздел Model Studio
Создайте API-ключ
Используйте OpenAI-совместимый интерфейс: задайте base_url как endpoint Alibaba Cloud и используйте стандартный Python-клиент openai

Способ 4: Hugging Face (для исследователей)

Все варианты модели доступны на huggingface.co/Qwen под открытой лицензией. Скачивайте веса напрямую и запускайте через transformers, vllm или другие фреймворки. Для полной 480B-модели потребуется несколько GPU: минимум 8xA100 80GB или эквивалент.

Первый запуск -- что попробовать

После установки Ollama и загрузки модели (или входа в chat.qwenlm.ai) вот что рекомендуем сделать в первый раз.

Задача 1: Попросите объяснить незнакомый код. Вставьте любой фрагмент кода, который вам непонятен -- на любом из 119 поддерживаемых языков. Qwen3-Coder хорошо работает с объяснением чужого кода, включая сложные конструкции и архитектурные паттерны.

Пример запроса: «Объясни этот код на Python и укажи возможные проблемы» + вставьте код.

Задача 2: Написание кода с нуля. Задайте конкретную задачу: «Напиши функцию на Python, которая читает CSV-файл, фильтрует строки по значению в столбце price больше 100, и сохраняет результат в новый CSV. Добавь обработку исключений и логирование.» Обратите внимание, как модель структурирует код, добавляет комментарии и обрабатывает граничные случаи.

Задача 3: Отладка и рефакторинг. Возьмите рабочий, но неаккуратный кусок кода из вашего проекта. Попросите: «Отрефактори этот код: улучши читаемость, следуй принципам SOLID, добавь типизацию». Сравните до и после.

Задача 4: Интеграция через MCP. Если вы используете Claude Code, Cursor или другой редактор с поддержкой MCP, Qwen3-Coder можно подключить как альтернативную модель. Это позволяет использовать её возможности прямо в вашем привычном окружении разработки.

Задача 5: Работа с большим контекстом. Запустите Qwen3-Coder на целом репозитории. Через Ollama это можно сделать программно: соберите все файлы проекта в один большой текст и задайте вопросы об архитектуре, зависимостях или потенциальных уязвимостях. Контекст в 256K токенов покрывает большинство средних проектов целиком.

Задача 6 (только через API): Создание агента для автоматизации. Qwen3-Coder поддерживает tool use (вызов инструментов) и хорошо работает как движок для агентных систем. Попробуйте построить простого агента, который анализирует ошибки в логах и предлагает патчи.

Ключевые фишки

Архитектура MoE (Mixture of Experts). 480B параметров -- это огромная модель, сопоставимая с крупнейшими проприетарными системами. Но MoE-архитектура означает, что при каждом запросе активируются только 35B из них -- около 7%. Это делает инференс (генерацию ответа) значительно быстрее и дешевле, чем у плотных (dense) моделей той же суммарной ёмкости. Результат: качество модели класса 480B при скорости работы модели класса 35B.

Open-source под Apache 2.0. Это самая важная характеристика с точки зрения практического использования. Apache 2.0 разрешает: использование в коммерческих продуктах, модификацию кода модели, создание производных работ, распространение. Запрещает только одно: убирать упоминание первоначальных авторов. Это принципиальное отличие от закрытых моделей вроде GPT или Claude.

119 языков программирования. Qwen3-Coder специально обучалась на широком спектре языков: от Python, JavaScript, TypeScript, Java, C++, Go, Rust -- до Solidity, CUDA, Assembly, R, MATLAB и многих других. Это делает её полезной для нишевых задач, с которыми узкоспециализированные инструменты справляются хуже.

Встроенная поддержка MCP (Model Context Protocol). MCP -- открытый протокол для взаимодействия языковых моделей с внешними инструментами: файловой системой, браузером, базами данных, API. Qwen3-Coder поддерживает MCP из коробки, что облегчает её встраивание в агентные системы и интеграцию с популярными редакторами кода.

Контекст 256K (до 1M). Нативное контекстное окно в 256 000 токенов -- это около 200 000 слов кода. При активации расширенного контекста (требует специальной конфигурации) модель может работать с окном до 1 миллиона токенов. Это позволяет анализировать крупные проекты целиком без необходимости разбивать их на части.

Результаты на Terminal-Bench 2.0. Бенчмарк Terminal-Bench 2.0 измеряет способность модели выполнять реальные задачи в командной строке: написание скриптов, управление файлами, работа с git, установка пакетов и т.д. Qwen3-Coder-480B на момент выхода показывает результаты на уровне или выше Claude 4.5 Opus, который является одной из лучших coding-моделей от Anthropic.

Линейка размеров для любого железа. Параллельно с флагманской 480B-версией Alibaba выпустила компактные варианты: 0.6B (запускается на телефоне), 1.7B, 4B, 8B, 30B-A3B (с активными 3B параметрами благодаря MoE) (хорошо работает на Mac M2/M3 с 16 GB), 32B (рекомендуется при 32+ GB RAM). Это означает, что начать использовать Qwen3-Coder можно на практически любом современном железе.

Цены и ограничения

Базовая модель Qwen3-Coder полностью бесплатна. Веса опубликованы на Hugging Face под Apache 2.0 -- скачивайте и запускайте без ограничений.

Стоимость разных способов использования:

Ollama (локально): бесплатно. Единовременные затраты -- покупка достаточного железа, если у вас его нет. Mac M3 Pro с 36 GB RAM (~$2500) отлично справляется с 32B-версией.
Qwen Chat (chat.qwenlm.ai): бесплатный тариф с дневным лимитом запросов. Платные тарифы -- уточняйте на сайте на момент использования.
Alibaba Cloud API: поминутная или потокенная тарификация. На момент написания конкурентоспособна с ценами Anthropic и OpenAI, особенно для больших объёмов. Проверяйте актуальный прайс на cloudscope.alibabacloud.com.
Hugging Face Inference API: доступен через стандартные тарифы HF, которые варьируются в зависимости от использованных вычислений.

Ограничения, которые важно знать:

Полная 480B-модель локально требует серьёзного железа: минимум 8 GPU класса A100 80GB или эквивалент. Для большинства пользователей единственный реалистичный вариант -- API или меньшие версии.
Модель специализирована на кодинге. Для общих разговорных задач, creative writing или сложных рассуждений вне программирования она уступает Qwen3-Chat или другим generalist-моделям.
Оценки на бенчмарках -- не всегда точный предиктор поведения в реальных задачах. Рекомендуем протестировать на вашем конкретном типе задач перед масштабным внедрением.
Контекст в 1M токенов через расширение требует специальной конфигурации и не доступен «из коробки» во всех интерфейсах.

Для команд, работающих с конфиденциальным кодом, Qwen3-Coder через Ollama или на собственном сервере -- это одновременно мощный и безопасный вариант: код не покидает инфраструктуру компании.

Нужен ли VPN из России

Qwen3-Coder -- продукт китайской компании Alibaba. Это существенно упрощает ситуацию для пользователей из России по сравнению с американскими AI-сервисами.

Локальная установка через Ollama: VPN не нужен совершенно. Веса модели скачиваются с серверов Ollama или Hugging Face. Hugging Face -- американская компания, но на момент написания не применяет географических ограничений на скачивание публичных моделей. После скачивания модель работает полностью оффлайн.

Qwen Chat (chat.qwenlm.ai): китайский сервис, доступен из России без VPN. Регистрация работает, генерация доступна.

Alibaba Cloud API: Alibaba Cloud -- международная платформа, которая работает с российскими пользователями. Для регистрации потребуется email и номер телефона. Ограничения на российские IP нет. Однако с оплатой могут быть сложности: российские банковские карты Visa/Mastercard с высокой вероятностью не пройдут. Используйте карты банков Казахстана, Армении, Грузии или другие доступные варианты.

Hugging Face (скачивание весов): открытый ресурс, доступен без VPN. Возможны медленные скорости скачивания из России -- это техническая, а не политическая проблема. При необходимости VPN поможет ускорить загрузку, выбрав маршрут через страну с лучшим пирингом.

Итоговые рекомендации по способам доступа из России:

Лучший вариант без VPN: скачать модель через Ollama и запустить локально -- это работает стабильно и бесплатно
Лучший веб-вариант без VPN: chat.qwenlm.ai -- китайский сервис без геоблокировки
API через Alibaba Cloud: доступно, но требует решения вопроса с оплатой
VPN нужен только если Hugging Face скачивает слишком медленно или если вы хотите обойти возможные будущие ограничения

Qwen3-Coder -- один из немногих по-настоящему топовых coding-инструментов, которые доступны из России без дополнительных усилий. Локальный запуск через Ollama снимает все вопросы о доступности разом.

Qwen 3.7 Max (анонс 20 мая 2026, Alibaba Cloud Summit)

На Alibaba Cloud Summit 20 мая 2026 года была анонсирована модель Qwen 3.7 Max -- следующее поколение флагманской модели Alibaba. Ключевые характеристики:

Контекстное окно 1M токенов (нативно, без технических ухищрений) -- позволяет анализировать крупные монорепозитории целиком
Native extended-thinking -- расширенный режим размышления встроен в базовую модель, не требует специальных промптов для активации
Agent-first design -- модель оптимизирована для работы в агентных сценариях: лучше следует многошаговым инструкциям, надёжнее вызывает инструменты, меньше отклоняется от заданного плана

Qwen3.7 Max для ревью кода: Qwen3.7 Max превосходит Qwen3-Coder по комплексным задачам проектирования и ревью кода благодаря расширенному контексту в 1M токенов и улучшенной архитектуре MoE.

Важно: Qwen 3.7 Max является API-only моделью - локальные веса не опубликованы и недоступны для скачивания. Доступ только через Alibaba Cloud Model Studio API (qwen-max-2026-05) и Qwen API. Для локального запуска используйте Qwen3.6-27B через Ollama (ollama pull qwen3.6-coder) - это лучший open-weight вариант от Alibaba на июнь 2026 года.

Qwen3-Coder-Next: линейка гибридных моделей

Alibaba выпустила серию Qwen3-Coder-Next -- гибридные модели для задач программирования с архитектурой 80B/3B (80 миллиардов параметров, 3 миллиарда активных). Серия оптимизирована для разработчиков, которым нужна высокая скорость при ограниченных вычислительных ресурсах:

Оптимизированы для локального запуска на ноутбуках и рабочих станциях
Используют технику speculative decoding для ускорения генерации
Совместимы с Ollama, llama.cpp и другими инструментами локального инференса

Детали конкретных размеров моделей серии Qwen3-Coder-Next уточняйте на huggingface.co/Qwen -- линейка продолжает пополняться.

Расширение линейки Qwen3-Coder (2026): Qwen3-Coder-Next: открытые веса (open-weight), обучена с применением RL, гибридная архитектура с комбинацией стандартного внимания и MoE. Qwen3-Coder-480B-A35B-Instruct: крупнейшая модель серии с 480 млрд параметрами (активно: 35 млрд), предназначена для наиболее сложных задач кодирования.

Qwen 3.7 Plus (1 июня 2026, GA): Alibaba выпустила Qwen 3.7 Plus -- мультимодальную проприетарную модель с поддержкой текста, изображений и видео. Важно: Qwen 3.7 Plus является проприетарной моделью (только облачный API, веса не публикуются) -- в отличие от open-source Qwen3-Coder. Стоимость API (на момент написания): около $0.40 за 1M входных токенов, $1.60 за 1M выходных. Доступна через Alibaba Cloud Model Studio API. Qwen 3.6 27B остаётся лучшим open-weight вариантом Alibaba для локального запуска и кодирования. По сравнению с Qwen 3.7 Max (анонсирован ранее, ориентирован на программирование и агентные задачи), Plus предназначен прежде всего для задач с визуальным контентом и предлагает более низкую стоимость API-запроса на токен.

Qwen3.7-Plus -- агентные возможности (уточнение, 2 июня 2026): Qwen3.7-Plus позиционируется как мультимодальный агентный ИИ нового типа. Ключевые агентные функции: чтение экрана -- модель анализирует скриншоты интерфейса и понимает содержимое GUI; управление GUI -- агент может выполнять действия в графическом интерфейсе (клики, ввод текста, навигация); генерация кода в едином агентном цикле -- переход от понимания задачи к написанию и выполнению кода без разрывов в контексте. Контекстное окно: 1M токенов -- позволяет удерживать историю многоходовых агентных сессий целиком. Стоимость: на момент написания, актуальные тарифы на Alibaba Cloud Model Studio.

Семейство Qwen3.7 - итог (июнь 2026): По состоянию на июнь 2026 года Alibaba предлагает два флагмана нового поколения. Qwen3.7-Max (анонс 20 мая 2026) - текстовая модель с контекстом 1M токенов, ориентирована на кодирование и архитектурные задачи; только через API, веса не публикуются. Qwen3.7-Plus (GA 1 июня 2026) - мультимодальный флагман с поддержкой текста, изображений и видео; также только через API, проприетарная модель. Оба через Alibaba Cloud Model Studio API. Для локального запуска в июне 2026 года Qwen3.6-27B остаётся лучшим выбором (open-weight, Apache 2.0, работает через Ollama). Qwen3-Coder-480B-A35B-Instruct также доступен через API для пользователей, которым нужна максимальная производительность через облако.

Как выбрать модель Qwen для кодирования (июнь 2026):

Локальный запуск (без интернета, приватность): Qwen3.6-27B через Ollama (ollama pull qwen3.6-coder) - лучший open-weight вариант, Apache 2.0
Максимальное качество через API: Qwen3-Coder-480B-A35B-Instruct через Alibaba Cloud Model Studio - флагманская coding-модель
Общие задачи через API: Qwen3.7-Max (API-only, 1M контекст) или Qwen3.7-Plus (API-only, мультимодальный)
Бесплатный веб-доступ: chat.qwenlm.ai - бесплатный tier, доступен из России

Обновление бенчмарков Qwen3-Coder (июнь 2026): После обновления модели Qwen3.6-27B показал значительный прогресс на SWE-Bench Verified: результат вырос с 45.8% до 69.6%. Это делает Qwen3-Coder одной из лучших открытых моделей для решения реальных задач в репозиториях на GitHub. Для сравнения: Claude Opus 4.8 набирает около 72% на том же бенчмарке, а GPT-5.5 -- около 71%. Qwen3-Coder при этом полностью открыт под Apache 2.0 и может работать локально. Обновление применяется автоматически при работе через API -- не требует переустановки.

Серия Qwen3-2507 (июнь 2026): Alibaba выпустила обновление серии Qwen3 под версионным тегом 2507. Ключевые модели: Qwen3-Instruct-2507 и Qwen3-Thinking-2507 (версия с улучшенным reasoning). Главное нововведение: контекстное окно расширено до 1 миллиона токенов, что позволяет анализировать крупные кодовые базы целиком без разбивки на части. Thinking-вариант применяет пошаговое размышление для сложных задач кодирования и оптимизации алгоритмов.

Qwen3-Coder против Qwen3.6-27B: в чём разница (июль 2026): Qwen3-Coder - это более новая и мощная серия по сравнению с Qwen3.6-27B. Qwen3.6-27B вышла в апреле 2026 года и стала первым поколением open-weight coder-моделей Alibaba. Qwen3-Coder с флагманской моделью 480B-A35B - следующий шаг: в 17 раз больше параметров, нативный контекст 256K токенов (расширяется до 1M), значительно лучшие результаты на SWE-Bench. Если Qwen3.6-27B можно запустить на MacBook Pro M3 Pro (36 GB RAM), то Qwen3-Coder 480B требует кластера GPU или Alibaba Cloud. Для локального запуска без серьёзного железа Qwen3.6-27B остаётся рекомендуемым вариантом.

Полная линейка Qwen3-Coder (июль 2026): Alibaba выпустила несколько вариантов в серии Qwen3-Coder под единой лицензией Apache 2.0. Флагман - 480B-A35B: 480 млрд параметров, из которых активны 35 млрд на запрос. Компактный вариант - 30B-A3B: 30 млрд параметров, 3 млрд активных; запускается на 1-2 GPU A100 или Mac Studio с 64 GB RAM. Гибридный вариант - Qwen3-Coder-Next (80B-A3B): баланс качества и скорости для команд с умеренными вычислительными ресурсами. Официальный Qwen Code CLI устанавливается командой npm install -g qwen-code и использует Qwen3-Coder в качестве backend по умолчанию.

Qwen 4 Coder: 82% на SWE-Verified (июль 2026)

Qwen 4 Coder (июль 2026). Alibaba выпустила следующее поколение coding-моделей под брендом Qwen 4 Coder. Флагман серии достиг 82% на SWE-Bench Verified - это значительный скачок по сравнению с Qwen3-Coder (72% на том же бенчмарке). Qwen 4 Coder распространяется с открытым исходным кодом под лицензией Apache 2.0 и доступен на HuggingFace. Для локального запуска: рекомендованный вариант через Ollama (ollama pull qwen4-coder). Через API: Alibaba предоставляет доступ через платформу DashScope (dashscope.aliyuncs.com). Важно: Qwen3.7 Max и Qwen3.7 Plus при этом являются закрытыми (closed-weight) моделями - они недоступны для локального запуска и работают исключительно через официальный API Alibaba, без публикации весов.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:ai-coding qwen alibaba open-source llm coding-model

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Как начать пользоваться Agno: Python-фреймворк для создания AI-агентов

Agno (бывший phidata) - один из самых популярных Python-фреймворков для построения AI-агентов с 39k+ звезд на GitHub. Пошаговый гайд: установка, первый агент за 5 минут, мультиагентные команды и деплой в продакшн.

2026-07-14·8 мин

С чего начать·Гайд

Seedance 2.5: как начать пользоваться генератором видео от ByteDance

Seedance 2.5 от ByteDance генерирует нативное 30-секундное видео в один проход, принимает до 50 мультимодальных референсов и позволяет редактировать отдельные фрагменты без перегенерации всего клипа.

2026-07-13·7 мин

С чего начать·Гайд

ChatGPT Work: как начать пользоваться агентным рабочим столом OpenAI

9 июля 2026 OpenAI запустила ChatGPT Work -- агента, который берёт у вас целый проект, сам планирует шаги, работает часами в фоне и возвращает готовый документ, таблицу или презентацию.

2026-07-13·8 мин