DeepSeek V4 заставил китайских облачников резать цены — Xiaomi снизил API на 99%

Релиз DeepSeek V4 запустил волну ценовой войны в Китае — Xiaomi и MiniMax переписывают экономику inference.

Aravana··1 мин

🔴 DeepSeek V4 заставил китайских облачников резать цены — Xiaomi снизил API на 99%

Когда DeepSeek в прошлом месяце релизнул V4, многие подумали, что это история «вышла модель — обсудили — забыли». Но за неделю в Китае началось что-то очень похожее на ценовую панику среди облачных провайдеров.

По данным AI Weekly, Xiaomi снизила цены API на свою модель MiMo-V2.5 на 99% — после чего обработка трафика выросла более чем на 999% и составила 1,7 трлн токенов в неделю. DeepSeek V4 сам по себе тарифицируется от $0,0036 за миллион кешированных входных токенов, что де-факто обнулило экономику конкурентов. MiniMax попыталась не лезть в гонку до нуля и переключилась на гибридную подписку $7,24–$69,28 в месяц. Глава MiMo Фули Луо комментирует: «Наш inference-движок работает почти на полной загрузке, и мы при этом выходим почти в ноль по марже». Параллельно более половины пользователей Xiaomi-API — иностранные разработчики, и это значит, что китайский ценник стал глобальным бенчмарком.

Для российского предпринимателя это меняет арифметику бюджета на AI. Запуск AI-моделей вашего продукта на китайских API дешевле в десятки и сотни раз против американских. Но платите за это вы не деньгами, а юрисдикционным риском, латентностью и тем, что архитектура продукта оказывается завязана на разработчика, чей след в открытых данных непредсказуем. Решение «китайский inference вместо OpenAI» теперь не маргинальное — это вопрос осознанного выбора риск-профиля.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #DeepSeek #Китай #чиповаявойна #рынок #агентыИИ #инфраструктура #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Apple показала Siri AI на WWDC — голосовой помощник наконец получил мозги

Купертино переписал Siri с нуля — теперь это полноценный AI-ассистент на собственных моделях, без OpenAI и Gemini.

·1 мин

Google переключил NotebookLM на Gemini 3.5 и добавил полноценные кодинг-функции

NotebookLM из инструмента «прочитай за меня документ» превращается в полноценную AI-среду с кодом и агентами.

·1 мин