Все Insights

Meta Llama 4: открытый исходный код меняет правила игры

Meta выпустила Llama 4 -- самую мощную open-source модель в истории. Разбираемся, как это влияет на баланс сил между открытыми и закрытыми AI-системами.

Aravana··9 мин

Тип материала: Анализ

Поделиться:TelegramXLinkedIn

В феврале 2026 года Meta представила Llama 4 -- четвертое поколение своей открытой языковой модели. Релиз включает три версии: Llama 4 Scout (17 миллиардов параметров), Llama 4 Maverick (85 миллиардов) и флагманский Llama 4 Behemoth (более 400 миллиардов). По результатам независимых тестов, Maverick сопоставим с GPT-4o, а Behemoth приближается к GPT-5 на задачах reasoning.

Главное нововведение -- архитектура Mixture of Experts (MoE), которую Meta довела до совершенства. Llama 4 Maverick использует 128 экспертов, из которых активируются только 16 на каждый токен. Это означает, что модель с 85 миллиардами параметров работает со скоростью и стоимостью модели в 17 миллиардов, при этом сохраняя качество большой модели.

Meta сделала Llama 4 по-настоящему мультимодальной. Модель нативно обрабатывает текст, изображения, видео и аудио. Контекстное окно увеличено до 1 миллиона токенов для Scout и 10 миллионов для Maverick -- рекордные показатели для open-source моделей. Это открывает возможности для анализа целых кодовых баз, длинных документов и видеоконтента.

Лицензия осталась открытой с привычными ограничениями: бесплатна для коммерческого использования компаниями с менее чем 700 миллионами активных пользователей в месяц. Для более крупных организаций требуется отдельное соглашение. На практике это означает, что 99.9% компаний могут использовать Llama 4 бесплатно.

Для разработчиков особенно важна экосистема: Llama 4 доступна на Hugging Face, AWS Bedrock, Azure, Google Cloud и десятках других платформ. Meta также выпустила Llama Stack -- набор инструментов для файн-тюнинга, дистилляции и деплоя. Порог входа для работы с моделями уровня GPT-4 радикально снизился.

Реакция рынка была смешанной. Акции компаний, продающих доступ к закрытым моделям, просели на 3-5% в день анонса. С другой стороны, компании, строящие продукты поверх open-source моделей, получили мощный импульс. Стартапы вроде Together AI и Fireworks AI зафиксировали рост запросов на инференс Llama 4 на 400% в первую неделю.

Стратегия Meta понятна: компания зарабатывает не на моделях, а на рекламе. Чем больше разработчиков строят на Llama, тем сильнее экосистема Meta и тем выше барьер для конкурентов. Это классический platform play, и он работает. По данным самой Meta, более 350 миллионов загрузок моделей семейства Llama произошло к моменту релиза четвертого поколения.

Есть и критика. Behemoth пока доступен только в ранней версии, а его веса не опубликованы полностью -- Meta обещает полный релиз во втором квартале. Кроме того, для запуска Behemoth требуется минимум 8 GPU H100, что делает его недоступным для небольших команд. Scout и Maverick, впрочем, запускаются на куда более скромном железе.

Влияние Llama 4 на рынок труднo переоценить. Open-source модели такого уровня демократизируют доступ к AI: теперь любая компания может развернуть модель уровня GPT-4o на собственной инфраструктуре, сохраняя полный контроль над данными и кастомизацией. Для enterprise-клиентов с требованиями к приватности это принципиально.

Что это значит: Llama 4 сокращает разрыв между открытыми и закрытыми моделями до минимума. Закрытые модели по-прежнему лидируют на самых сложных задачах, но для 80% бизнес-применений open-source уже достаточно. Это давит на ценообразование OpenAI и Anthropic и ускоряет демократизацию AI.

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Похожие материалы

110 миллиардов за мечту: что стоит за рекордным раундом OpenAI

OpenAI привлекла крупнейший раунд в истории венчурного рынка — $110 млрд при оценке $730 млрд. Разбираемся, кто дал деньги, зачем столько и что это значит для индустрии.

·4 мин·Выбор редакции

GPT-5.4 vs Claude Opus 4.6 vs Gemini 3.1 Pro: кто лучший в 2026 году

Три флагмана, десятки бенчмарков, ноль однозначных ответов. Разбираемся, какая модель реально лидирует — и почему ответ зависит от задачи.

·5 мин·Выбор редакции

AI для программистов: Claude Code vs Cursor vs Copilot vs Devin

Четыре подхода к AI-ассистированному кодингу: от автокомплита до полностью автономного агента. Разбираемся, кто для чего.

·5 мин·Выбор редакции