Все Insights

Qwen: как Alibaba тихо построила одну из сильнейших модельных семей в мире

От Qwen 2.5 до Qwen 3.5 — путь китайского гиганта к глобальной конкурентоспособности в открытых LLM

Aravana··10 мин

Тип материала: Анализ

Поделиться:TelegramXLinkedIn

Qwen: как Alibaba тихо построила одну из сильнейших модельных семей в мире

От Qwen 2.5 до Qwen 3.5 — путь китайского гиганта к глобальной конкурентоспособности в открытых LLM

Если вы следите за ИИ-моделями преимущественно через англоязычные медиа, вы, вероятно, слышали о ChatGPT, Claude, Gemini и Llama. Возможно, о DeepSeek. Но семейство моделей Qwen от Alibaba Cloud часто остаётся в тени — и совершенно незаслуженно. Мы хотим это исправить, потому что то, что сделала команда Qwen за последние полтора года, — это одна из самых впечатляющих историй в мировой ИИ-индустрии.

Начнём с фактов. Qwen 2.5, выпущенная осенью 2025 года, стала одной из лучших открытых моделей в мире. На бенчмарках MMLU, HumanEval, GSM8K и MATH она показывала результаты, сопоставимые с GPT-4-turbo и превосходящие Llama 3.1 405B. И это была открытая модель — с доступными весами, с разрешительной лицензией, которую мог скачать и использовать любой. В китайском ИИ-сообществе Qwen 2.5 стала стандартом де-факто: большинство стартапов, которым нужна сильная базовая модель, начинали с неё.

Путь к Qwen 2.5 был непростым. Первое поколение — Qwen 1.0, выпущенная в конце 2023 года — была компетентной, но не выдающейся моделью, уступавшей и GPT-4, и Llama 2. Qwen 1.5 (начало 2024) показала заметное улучшение, но всё ещё находилась во втором эшелоне. Настоящий прорыв произошёл с Qwen 2 (лето 2024), которая впервые продемонстрировала конкурентоспособность с мировыми лидерами на ряде бенчмарков. А Qwen 2.5 закрепила этот успех и вывела Alibaba в первую лигу. Каждое поколение — это результат колоссальной работы по улучшению данных, архитектуры и процесса обучения. Никаких «волшебных» решений — просто системное, последовательное улучшение по всем фронтам.

Но Alibaba не остановилась. Qwen 3, вышедшая в ноябре 2025 года, принесла ряд архитектурных инноваций. Главная из них — гибридная архитектура с динамическим переключением между dense и Mixture of Experts режимами. Модель сама решает, какой режим использовать для каждого запроса: простые задачи обрабатываются «лёгким» MoE-режимом (активируется 20-30% параметров), а сложные — «тяжёлым» dense-режимом (активируются все параметры). Это позволяет существенно снизить стоимость инференса без потери качества на сложных задачах.

Технически это реализовано через «маршрутизатор», который анализирует входящий запрос и на основе его сложности определяет количество активируемых экспертов. Маршрутизатор обучается совместно с основной моделью, что позволяет ему точно оценивать сложность задач. На практике это означает, что 70-80% запросов обрабатываются в «лёгком» режиме с минимальными вычислительными затратами, и лишь 20-30% наиболее сложных запросов задействуют полную мощность модели. Экономия ресурсов — колоссальная.

Qwen 3.5, анонсированная в феврале 2026 года, — это текущий флагман семейства. По предварительным бенчмаркам, она конкурирует с GPT-5 и Claude Opus на задачах программирования и математики, и превосходит их на ряде задач, связанных с обработкой китайского языка (что ожидаемо) и мультимодальным пониманием (что уже интереснее). Мультимодальность — одна из сильнейших сторон Qwen: модель обрабатывает текст, изображения, аудио и видео в единой архитектуре.

Масштаб семейства Qwen — это отдельная тема. Alibaba выпускает не одну модель, а целую линейку: Qwen-72B, Qwen-32B, Qwen-14B, Qwen-7B, Qwen-3B, Qwen-1.5B, Qwen-0.5B. Каждый размер оптимизирован под свой сценарий использования: от облачного инференса на мощных серверах до запуска на мобильных устройствах. Есть специализированные версии: Qwen-Coder для программирования, Qwen-Math для математики, Qwen-VL для работы с визуальным контентом, Qwen-Audio для аудио. Экосистема, сопоставимая по широте с тем, что делает Meta с Llama.

Особо стоит отметить Qwen-Coder — версию, специализированную на программировании. По нашим наблюдениям и по независимым бенчмаркам, Qwen-Coder 32B является одной из лучших открытых моделей для программирования. Она конкурирует с DeepSeek Coder V2 и превосходит Code Llama на большинстве задач. Для тысяч разработчиков по всему миру, которые используют ИИ-ассистенты для написания кода, Qwen-Coder стала инструментом первого выбора — особенно для тех, кто предпочитает локальный запуск.

Мы хотим обратить внимание на стратегический аспект. Alibaba — это не исследовательская лаборатория. Это крупнейшая облачная компания Китая. И Qwen — это не академический проект, а коммерческий продукт, встроенный в облачную платформу Alibaba Cloud (Aliyun). Каждый клиент Alibaba Cloud — а это миллионы компаний в Китае и Юго-Восточной Азии — получает доступ к моделям Qwen через API. Это создаёт масштаб распространения, которого не может достичь ни один стартап.

Открытость Qwen — это сознательная стратегия, а не жест доброй воли. Alibaba делает модели открытыми, потому что это привлекает разработчиков на платформу Alibaba Cloud. Логика та же, что у Meta с Llama: чем больше людей используют вашу модель, тем больше они зависят от вашей экосистемы. Но в отличие от Meta, Alibaba имеет прямую финансовую модель монетизации через облако. Каждый стартап, который обучает свой продукт на Qwen и деплоит его в Alibaba Cloud, — это клиент, платящий за инференс, хранение данных и вычислительные ресурсы.

Команда Qwen заслуживает отдельного упоминания. Под руководством Цзиньгрена Чжоу (Jingren Zhou) в подразделении DAMO Academy работают несколько сотен исследователей. Многие из них — выпускники ведущих мировых университетов, которые вернулись в Китай. Публикации команды регулярно появляются на NeurIPS, ICML и ACL. Качество исследований — на мировом уровне, и это не преувеличение.

Есть интересный аспект международной экспансии. Qwen активно используется в Юго-Восточной Азии, на Ближнем Востоке и в Африке — регионах, где Alibaba Cloud уже имеет сильное присутствие. Для этих рынков Alibaba создаёт локализованные версии моделей с поддержкой арабского, малайского, тайского и других языков. Это стратегия, которую ни OpenAI, ни Anthropic, ни Google не реализуют с таким же системным подходом. Alibaba заполняет языковые ниши, которые западные компании считают слишком маленькими для инвестиций, — и тем самым захватывает рынки, которые могут оказаться значительными через пять-десять лет.

Мы также отмечаем, что Qwen стала основой для множества производных продуктов. Десятки китайских стартапов строят свои решения на основе дообученных версий Qwen. В экосистеме Hugging Face модели семейства Qwen стабильно входят в топ-5 по количеству загрузок. На платформах вроде Ollama и LM Studio Qwen — один из самых популярных выборов для локального запуска. Сообщество вокруг Qwen огромно и активно.

Мы хотим обратить внимание и на Qwen-VL — модель для работы с визуальным контентом. В тестах на понимание изображений (OCR, описание сцен, ответы на вопросы по картинкам) Qwen-VL 3.5 показывает результаты, сопоставимые с GPT-4V и превосходящие Gemini Pro на ряде бенчмарков. Для практических применений — от анализа медицинских снимков до автоматического описания товаров в e-commerce — это критически важная возможность. Alibaba использует Qwen-VL внутри своей торговой платформы Taobao для автоматической категоризации и описания миллионов товаров. Это не демонстрация технологии, а работающий бизнес-инструмент, обрабатывающий миллиарды запросов.

Финансовая модель Qwen тоже заслуживает анализа. Alibaba предлагает доступ к Qwen через API по ценам, которые значительно ниже конкурентов. Qwen 3.5 через Alibaba Cloud API стоит примерно 0.5 доллара за миллион входящих токенов — в три-четыре раза дешевле, чем GPT-4-turbo через OpenAI API. Это не демпинг — это отражение более низкой стоимости инференса благодаря гибридной архитектуре и оптимизации под собственную инфраструктуру. Для стартапов и малых компаний, которые чувствительны к стоимости API, это существенный аргумент.

Конкуренция внутри Китая — отдельная тема. Qwen конкурирует не только с западными моделями, но и с DeepSeek, Baidu ERNIE, ByteDance Doubao и десятками других китайских LLM. Эта внутренняя конкуренция — мощный двигатель прогресса. Каждый крупный релиз одной компании вынуждает остальных ускоряться. Темп выхода новых моделей в Китае — примерно вдвое выше, чем на Западе. Это создаёт среду, в которой стагнация просто невозможна.

Отдельная тема — Qwen и вопросы цензуры. Как и все модели, обученные и распространяемые из Китая, Qwen содержит встроенные фильтры, которые ограничивают генерацию контента на определённые темы — от событий на площади Тяньаньмэнь до вопросов о Тайване. Для китайского рынка это нормативное требование, но для международных пользователей это создаёт неудобства. Часть сообщества решает проблему прямолинейно — дообучая модели без ограничений на собственных данных. Но это поднимает более глубокий вопрос: может ли по-настоящему открытая модель иметь встроенные ограничения, определяемые политикой конкретного государства? Мы не знаем ответа, но считаем этот вопрос важным.

Производительность Qwen на мультиязычных задачах заслуживает отдельного упоминания. Alibaba инвестировала значительные ресурсы в обучение модели на данных более чем на 30 языках. Результат: Qwen 3.5 показывает сильные результаты не только на китайском и английском, но и на японском, корейском, арабском, испанском и русском. Для сравнения: Llama от Meta традиционно сильна на английском, но заметно слабее на других языках. Claude и GPT-5 хорошо работают на основных европейских языках, но уступают Qwen на языках Азии и Ближнего Востока. Для глобального рынка ИИ это имеет огромное значение — большинство пользователей в мире не говорят по-английски.

Нельзя не упомянуть и Qwen-Agent — фреймворк для создания ИИ-агентов на основе моделей Qwen. Выпущенный в конце 2025 года, он позволяет строить автономные системы, способные использовать инструменты, взаимодействовать с API и выполнять многошаговые задачи. Это направление — агентные системы — считается одним из наиболее перспективных в ИИ-индустрии. И Alibaba, предлагая и модель, и фреймворк, и облачную инфраструктуру для запуска агентов, создаёт замкнутую экосистему, из которой разработчикам всё сложнее выйти. Стратегия lock-in, знакомая по эпохе облачных вычислений, воспроизводится в эпохе ИИ.

Мы хотим отдельно остановиться на том, как Qwen используется в реальных бизнес-приложениях. Alibaba публикует кейсы, которые дают представление о масштабе внедрения. Логистическая компания Cainiao (дочерняя структура Alibaba) использует Qwen для оптимизации маршрутов доставки — это экономит, по заявлениям компании, 15% затрат на логистику. Ant Group (Alipay) применяет Qwen для обнаружения мошенничества — модель анализирует транзакции в реальном времени и выявляет подозрительные паттерны. Alibaba Health использует Qwen-VL для анализа рентгеновских снимков и КТ-изображений — точность диагностики, по клиническим испытаниям, сопоставима с результатами опытных рентгенологов. Это не лабораторные демонстрации — это production-системы, обрабатывающие миллиарды запросов.

Мы считаем, что Qwen — это модельное семейство, за которым нужно следить так же внимательно, как за продуктами OpenAI и Google. Не потому, что Alibaba обязательно победит в «гонке ИИ» — а потому, что подход Alibaba — массовое открытое распространение высококачественных моделей через облачную платформу — может оказаться более устойчивой бизнес-моделью, чем подписки и API-тарифы западных компаний.

Мы наблюдаем ещё одну тенденцию: Qwen всё чаще используется как основа для «суверенных моделей» — национальных ИИ-систем, которые страны создают для своих нужд. Саудовская Аравия, Малайзия, Индонезия — все эти страны объявили о планах создания национальных LLM. И многие из них используют Qwen как отправную точку: берут открытую модель, дообучают на национальных данных (законодательство, культурный контекст, языковые особенности) и запускают как «свою». Для Alibaba это идеальный сценарий: каждая «суверенная модель» на базе Qwen — это страна, привязанная к экосистеме Alibaba. Облачная инфраструктура, инструменты для fine-tuning, техническая поддержка — всё это монетизируемые сервисы.

Мы также отмечаем, что Qwen активно развивается в направлении reasoning-моделей. Qwen-QwQ (Qwen with Questions) — экспериментальная версия, выпущенная в начале 2026 года, — специализируется на сложных логических задачах. По предварительным данным, она конкурирует с OpenAI o1 и DeepSeek R1 на математических и кодинговых бенчмарках. Это показывает, что Alibaba не просто воспроизводит подходы конкурентов, а активно экспериментирует с архитектурами и методами обучения.

Наконец, стоит упомянуть инфраструктурные инвестиции Alibaba. В 2025 году компания объявила о планах инвестировать более 50 миллиардов юаней (7 миллиардов долларов) в расширение облачной инфраструктуры для ИИ. Это включает строительство новых дата-центров, оснащённых как NVIDIA GPU, так и Huawei Ascend и собственными ускорителями Alibaba (Hanguang 800). Масштаб инвестиций отражает масштаб амбиций: Alibaba строит инфраструктуру не для текущего спроса, а для спроса, который, по её расчётам, вырастет в десять раз в ближайшие три-пять лет.

Вот вопрос, над которым мы размышляем: если лучшие открытые модели всё чаще приходят из Китая, то не переместится ли центр мировой ИИ-экосистемы — со всеми её разработчиками, стартапами и инновациями — вслед за этими моделями, из Кремниевой долины в Ханчжоу и Пекин? И если это произойдёт, будет ли это благом для мирового развития ИИ — или создаст новые формы зависимости, просто с другим географическим и политическим знаком? И готов ли мир к тому, что «дефолтная» открытая модель для большинства разработчиков на планете будет китайской — со всеми вытекающими вопросами о встроенных ценностях, ограничениях и приоритетах? Это вопрос, который выходит далеко за рамки технологий и затрагивает фундаментальные проблемы глобального управления искусственным интеллектом — проблемы, для решения которых у нас пока нет ни институтов, ни механизмов, ни даже общего языка. И именно поэтому мы считаем историю Qwen не просто технической, а цивилизационной — её последствия будут ощущаться десятилетиями, и осмысливать их нужно начинать уже сейчас, пока ещё есть время для формирования конструктивных ответов. Мир ИИ меняется быстрее, чем мы успеваем адаптироваться, и Qwen — одна из сил, определяющих направление и скорость этих изменений. Мы продолжим наблюдать за каждым релизом, каждым стратегическим решением и каждым новым партнёрством Alibaba — потому что от них зависит будущее, которое не просто «наступает», а формируется прямо сейчас, на наших глазах, с каждым новым обновлением Qwen.

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Похожие материалы

Baidu: от поисковика до полного ИИ-стека — чипы, модели, беспилотники

M100 Kunlun, ERNIE 5.0 и миллионы поездок Apollo Go — как Baidu строит вертикально интегрированный ИИ-бизнес

·10 мин

AI-стратегия Южной Кореи: государственный план на 47 миллиардов долларов

Южная Корея объявила о крупнейшей в своей истории инвестиционной программе в области искусственного интеллекта: 47 миллиардов долларов государственных и частных средств до 2030 года.

·5 мин

DeepSeek R1: шоковая волна, которая изменила правила игры

Как китайская лаборатория за один релиз перевернула представления о стоимости и доступности передового ИИ

·10 мин