Как начать пользоваться Mistral Medium 3.5: топовая европейская open-weight модель
Mistral Medium 3.5 -- 128-миллиардная open-weight модель от Mistral AI, объединившая chat, reasoning и coding. MIT-лицензия, 256K контекст, 77,6% на SWE-bench. Гайд: Le Chat, API и локальный запуск.
Что это и для кого
Mistral Medium 3.5 -- крупная языковая модель с открытыми весами, выпущенная французской компанией Mistral AI 30 апреля 2026 года. Ключевая идея релиза: объединение трёх ранее раздельных продуктов компании в единую модель. Medium 3.1 отвечал за разговорные задачи и анализ; Magistral -- за глубокие рассуждения, математику и цепочки логических шагов; Devstral 2 -- за агентное программирование и работу с реальными репозиториями. Теперь все три класса задач покрывает одна пара весов под именем Medium 3.5. По словам команды Mistral, это «три модели по цене одной»: архитектурно и технически это не компромиссное слияние, а полноценная frontier-модель, одновременно конкурентоспособная в каждом из трёх направлений.
Технические характеристики модели: 128 миллиардов параметров в плотной (dense, а не MoE) архитектуре, контекстное окно 256 000 токенов, нативный визуальный энкодер, обученный с нуля для обработки изображений любого размера и соотношения сторон. На бенчмарке SWE-bench Verified -- 77,6%, что означает способность решать три четверти реальных задач программирования из GitHub Issues. Лицензия Modified MIT допускает свободное коммерческое использование и файнтюнинг без ограничений, при условии сохранения атрибуции. Для запуска достаточно четырёх GPU -- важный параметр для корпоративного самохостинга.
Mistral AI была основана в 2023 году выходцами из Google DeepMind и Meta и за три года стала крупнейшим европейским AI-стартапом с оценкой свыше шести миллиардов долларов. Medium 3.5 появился в момент, когда европейские open-weight модели по большинству бенчмарков вышли на уровень лучших американских проприетарных систем. Для российского и европейского рынков это практически важно: Mistral работает под французским законодательством и законодательством ЕС, что принципиально отличает компанию от американских провайдеров с точки зрения доступности, GDPR-соответствия и долгосрочной предсказуемости сервиса.
Целевая аудитория Mistral Medium 3.5 охватывает несколько категорий. Разработчики получают мощную coding-модель с возможностью держать весь контекст крупного репозитория в одном окне. Аналитики и юристы -- 256K токенов для обработки объемных документов целиком без потери деталей. Команды с требованиями конфиденциальности -- открытые веса позволяют развернуть модель полностью на собственной инфраструктуре без передачи данных третьим сторонам. Дополнительная аудитория -- пользователи Work Mode в Le Chat: это агентный режим на основе Medium 3.5, где модель не просто отвечает на вопросы, но и выполняет реальные действия в email, календаре, Jira и GitHub. Work Mode переводит Medium 3.5 из класса «умный чат» в класс «цифровой сотрудник».
Как зарегистрироваться / установить
Существует три пути к Mistral Medium 3.5. Первый -- веб-интерфейс Le Chat, не требующий установки ничего: идеален для быстрого старта и разовых задач. Второй -- API Mistral для разработчиков, встраивающих модель в собственные продукты и рабочие процессы. Третий -- локальное развертывание с открытыми весами для максимальной конфиденциальности и независимости от внешней инфраструктуры. Выбор определяется сочетанием технического уровня команды, требований к безопасности данных и характера задач.
Через Le Chat: перейдите на la.ai и нажмите Sign Up. Регистрация занимает около минуты -- доступны варианты через Google, GitHub или обычный email. После подтверждения адреса войдите в аккаунт и найдите переключатель модели: обычно он расположен под полем ввода или в верхнем меню. Выберите Mistral Medium 3.5. Бесплатный план дает ограниченный дневной доступ к модели, достаточный для оценки и разовых задач. Work Mode -- агентный режим с реальными инструментами -- включается на платном тарифе, цена которого уточняется на сайте.
Через API: откройте console.mistral.ai и создайте аккаунт. В разделе API Keys нажмите Create new key, дайте ключу понятное имя, например «medium-35-prod». Скопируйте ключ немедленно -- он отображается только один раз. Установите официальную библиотеку: для Python выполните в терминале pip install mistralai, для Node.js -- npm install @mistralai/mistralai. Идентификатор модели в запросах: mistral-medium-3-5. Всегда передавайте ключ через переменную среды MISTRAL_API_KEY, а не хардкодьте в коде -- это стандарт безопасности. При регистрации предоставляется стартовый бесплатный кредит для первого знакомства с API.
Через локальный деплой: скачайте веса модели с HuggingFace по запросу mistralai/Mistral-Medium-3-5. Они доступны под Modified MIT License -- бесплатно, включая коммерческое применение. Для запуска через Ollama выполните ollama pull mistral-medium-3-5 (если модель добавлена в реестр к моменту прочтения). Для продакшн-деплоя на корпоративных серверах рекомендуется vLLM или SGLang -- ознакомьтесь с официальной документацией Mistral для конкретных настроек. Минимальные аппаратные требования: четыре GPU с суммарным объемом VRAM около 320 гигабайт, например четыре NVIDIA A100 по 80 GB.
Первый запуск -- что попробовать
Оптимальный первый шаг -- войти в Le Chat с выбранным Medium 3.5 и проверить три класса задач. Начните с длинного контекста. Вставьте объемный документ -- юридический договор, финансовый отчет, большой фрагмент кода или несколько статей -- и задайте конкретные вопросы: «Найди все условия расторжения с упоминанием штрафных санкций», «Выяви все функции, работающие с персональными данными пользователей», «Сравни три приложенных отчета по десяти финансовым показателям и выдели тренды». Модель обрабатывает весь материал целиком, не теряя деталей из начала документа при работе с концом -- именно это делает 256K-контекст практически полезным.
Второй класс -- программирование. Medium 3.5 унаследовала от Devstral 2 умение работать с реальными репозиториями. Попробуйте: «Напиши функцию парсинга JSON с обработкой вложенных объектов произвольной глубины», «Вот traceback из продакшна -- найди причину и предложи исправление», «Спроектируй схему базы данных для системы управления подписками с поддержкой нескольких валют и временных зон». Результат 77,6% на SWE-bench означает, что три четверти реальных задач, поднятых в GitHub Issues, модель решает без вмешательства человека.
Третий класс -- мультимодальные задачи. Загрузите изображение: скриншот пользовательского интерфейса, схему архитектуры системы, диаграмму потока данных или фотографию таблицы из распечатанного документа. «Опиши эту архитектурную схему и укажи потенциальные узкие места», «Напиши React-компонент, реализующий этот UI по макету на скриншоте», «Извлеки все числовые данные из таблицы на фото и рассчитай итоги». Нативный визуальный энкодер Medium 3.5 обрабатывает изображения без промежуточных шагов, сохраняя мелкие детали -- текст на кнопках, числа в ячейках, линии соединений на схемах.
Work Mode в Le Chat (платный тариф): подключите интеграции через раздел Settings -- Google Workspace, Microsoft 365, Jira, GitHub, Slack. После подключения задайте многошаговое задание: «Проверь письма за последние три дня с темой Invoice, составь список должников по суммам, добавь напоминание в Google Calendar на пятницу и отправь краткую сводку в Slack канал #finance». Агент выполнит всю цепочку, показывая каждый шаг перед выполнением -- что позволяет остановить любое нежелательное действие до того, как оно произошло.
Ключевые фишки
Объединение трёх специализированных моделей. До Medium 3.5 разработчики на стеке Mistral выбирали между несколькими endpoint-ами: Medium 3.1 для разговора, Magistral для рассуждений, Devstral 2 для кода. Каждая модель -- отдельные веса, отдельная интеграция, отдельное администрирование. Medium 3.5 заменяет их одной точкой доступа без регрессии ни по одному из направлений. Для AI-приложений, задействующих все три типа задач, это упрощение архитектуры и снижение операционной сложности.
Нативная мультимодальность с энкодером нового поколения. Визуальная часть Medium 3.5 обучалась совместно с языковой с нуля -- не надстройка через CLIP или аналогичную архитектуру поверх готовой LLM, а интегрированная компонента. Это дает более точную обработку изображений: мелкий текст на скриншотах, числа в сложных таблицах, пространственные отношения на схемах. Поддерживаются форматы JPEG, PNG, GIF, WebP с произвольным соотношением сторон без деформации.
256К-токенный контекст с сохранением внимания. Контекстное окно 256 000 токенов -- это примерно 200 страниц плотного текста или крупный монорепозиторий в одном запросе. Mistral специально работал над качеством обработки длинного контекста: модель не «забывает» информацию из начала документа при работе с его концом, что характерно для ряда конкурирующих моделей. Для RAG-систем это означает возможность работать без разбивки на чанки с большинством корпоративных документов.
Work Mode как агентная платформа. Medium 3.5 проектировалась как ядро агентных систем, а не просто языковая модель для чата. Work Mode в Le Chat -- практическая демонстрация этого: агент подключается к реальным системам (почта, календарь, проектный трекер, репозиторий), выполняет многошаговые задачи и показывает каждое действие для одобрения перед исполнением. Это делает агентные возможности Medium 3.5 доступными без написания кода.
Modified MIT License. Практически свободное коммерческое использование: развертывание на собственных серверах, встраивание в продукт, файнтюнинг под конкретные задачи. Ограничений на коммерческое применение нет. Для корпоративного самохостинга -- оптимальная комбинация frontier-возможностей с полным контролем над данными и инфраструктурой.
Цены и ограничения
Mistral Medium 3.5 доступна в трёх форматах. Открытые веса с HuggingFace -- бесплатно, платите только за железо и электричество. API Mistral -- тарификация по токенам без абонентской платы: $1,50 за миллион входящих токенов и $7,50 за миллион исходящих на момент написания материала. Le Chat -- бесплатный план с дневными лимитами или платная подписка для Work Mode и снятия лимитов. Стартовый бесплатный кредит при регистрации на console.mistral.ai позволяет начать без вложений. Актуальные цены проверяйте на сайте -- они могут меняться.
Аппаратные требования для самохостинга: полная версия Medium 3.5 требует минимум четыре GPU класса A100 с суммарным VRAM около 320 гигабайт. Это реальный сценарий для крупных компаний и облачных провайдеров, но дорого для индивидуального использования. Квантизация до 4-bit снижает требования примерно вдвое при небольшой потере качества -- измерьте деградацию на ваших конкретных задачах. Через облачный API скорость генерации выше, чем при локальном запуске на потребительских GPU, из-за оптимизированной инфраструктуры Mistral.
Нужен ли VPN из России
Mistral AI -- французская компания с головным офисом в Париже, работающая под французским законодательством и нормами ЕС. Для российских пользователей это дает ряд практических преимуществ в сравнении с американскими AI-провайдерами. API Mistral (api.mistral.ai) как правило работает без VPN из большинства российских регионов -- в отличие от OpenAI API и Anthropic API, официально заблокированных для доступа из России. Рекомендуется самостоятельно проверить доступность с вашего конкретного провайдера: ситуация может меняться, и для критичных бизнес-применений стоит иметь резервный VPN на случай изменений политики.
Веб-интерфейс Le Chat (la.ai) также обычно доступен без VPN. Для оплаты API и подписки Le Chat: карты российских банков не принимаются из-за санкционных ограничений. Рабочие варианты -- карты банков Армении, Казахстана, Грузии или криптоплатежи при их поддержке платформой. Ситуация с платежами у каждого пользователя может отличаться в зависимости от конкретного банка-эмитента и страны его юрисдикции.
Самохостинг как путь к полной независимости: скачайте веса Mistral Medium 3.5 с HuggingFace под Modified MIT License и разверните на корпоративных GPU-серверах. В этом режиме API Mistral вообще не используется, никакого внешнего соединения с серверами компании нет -- весь трафик остается внутри вашей инфраструктуры. Никаких платежных карт, никакого VPN, никаких зависимостей от внешних сервисов. Для российских организаций с GPU-оборудованием и долгосрочными планами по использованию AI -- это наиболее надежный и предсказуемый путь, полностью изолированный от любых изменений внешней политики провайдера.
Work mode в Le Chat - многошаговый агент (июнь 2026). В июне 2026 года Mistral обновил Work mode в Le Chat: теперь это полноценный многошаговый агент для сложных исследовательских задач и автономных действий между инструментами. Агент самостоятельно разбивает задачу на шаги, выполняет веб-поиск, анализирует документы и обращается к подключённым сервисам (Google Workspace, Microsoft 365, GitHub) без необходимости вручную направлять каждое действие. Это делает Work mode сопоставимым по возможностям с Deep Research от OpenAI и аналогичными функциями в Claude. Доступен пользователям платного тарифа Le Chat Pro.
Настраиваемый уровень рассуждения (reasoning effort). Mistral Medium 3.5 поддерживает настройку уровня рассуждения для каждого запроса через параметр reasoning effort. Это позволяет балансировать между скоростью и глубиной анализа: для быстрых справочных запросов выберите минимальный уровень, для сложного кода или многошаговых задач - максимальный. Функция доступна через API (параметр в запросе) и через интерфейс Le Chat Pro. Гибкая настройка позволяет оптимизировать расходы: не тратить ресурсы на простые задачи и получать глубокий анализ там, где он действительно нужен.
Microsoft Copilot Studio (июнь 2026): Mistral Medium 3.5 добавлена в линейку поставщиков моделей для Microsoft Copilot Studio. Корпоративные пользователи могут выбрать Medium 3.5 в качестве базовой модели при создании собственных Copilot-агентов в Copilot Studio. Это открывает доступ к возможностям Mistral для компаний, работающих в экосистеме Microsoft 365, без необходимости настраивать отдельную API-интеграцию. Настройка: при создании нового агента в Copilot Studio выберите Mistral в разделе Model providers.
Vibe cloud coding agents (асинхронные): Mistral Medium 3.5 поддерживает Vibe -- облачных coding-агентов, работающих в асинхронном режиме. Агенты запускаются через API и выполняют кодинговые задачи в фоновом режиме: написание кода, ревью, тестирование, рефакторинг. Результат возвращается по webhook или через polling. Это позволяет встраивать мощь Medium 3.5 в CI/CD пайплайны без блокирующих синхронных вызовов.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Как начать пользоваться Cline: автономный AI-агент для кода прямо в VS Code
Полный гайд по Cline -- open-source AI-агенту для VS Code с 5 миллионами установок. Работает с любой моделью, редактирует файлы, выполняет команды в терминале, открывает браузер. Apache 2.0, bring-your-own-key.
Как начать пользоваться Vidu: AI-генератор видео из текста и фото
Полный гайд по Vidu -- китайскому AI-сервису для создания видео. Бесплатный тариф, три режима генерации: из текста, из фото и по референсу. Никакой установки -- работает в браузере.
Как начать пользоваться CodeRabbit: AI-ревью кода прямо в GitHub и GitLab
Гайд по CodeRabbit -- самому популярному AI-инструменту для автоматического ревью кода. 2 миллиона репозиториев, поддержка GitHub, GitLab, Azure DevOps и Bitbucket. Бесплатно для open-source проектов.