Daily Digest - 25 мая 2026

Microsoft режет Claude Code, DeepSeek снижает цены, ByteDance отдаёт мультимодальную модель: западный AI-стек дорожает, китайский становится самостоятельным.

Aravana··7 мин

Microsoft, главный корпоративный заказчик Anthropic, режет Claude Code: счёт за токены опередил выручку от агентов. В тот же день DeepSeek снижает цены и переезжает на чипы Huawei, а сама Huawei объявляет собственный закон масштабирования полупроводников, и китайский AI-стек собирается на глазах. ByteDance закрепляет тренд и открывает мультимодальную модель под Apache 2.0. Alibaba идёт с другого фланга: её Qwen 3.7 Max впервые проработал автономно больше суток без вмешательства, подскочила планка надёжности агентов. Параллельно Eli Lilly показывает препарат от ожирения, который по эффективности догоняет бариатрическую хирургию. Картина дня одна: западный AI-стек дорожает, китайский дешевеет и становится самостоятельным, а биотех тихо устанавливает новый стандарт.

Microsoft: при контракте на $30 млрд агентский AI всё равно не окупается

Microsoft отменяет «большинство» прямых лицензий Claude Code в подразделении Experiences & Devices: Windows, Office, Outlook, Teams и Surface. Дедлайн перехода назначен на 30 июня 2026 года, совпадает с концом финансового года Microsoft. Параллельная история: Uber сжёг весь бюджет 2026 года на AI-кодеров всего за 4 месяца, хотя сам же подгонял команды доской лидеров по использованию инструментов.

Контекст вмещается в одну формулу. Microsoft по Foundry-сделке вложила в Anthropic до $5 млрд, а в обмен Anthropic обязалась купить вычислений на Azure на $30 млрд. То есть деньги Microsoft уходят к Anthropic и тут же возвращаются в виде счёта за облако. Хорошая бухгалтерия для отчётности и плохая для бюджета внутренних команд: тот же счёт за токены оплачивают подразделения, которые работают в Claude Code.

Goldman Sachs ждёт 24-кратного роста потребления токенов к 2030 году, до 120 квадриллионов в месяц. Gartner успокаивает: стоимость запуска моделей (это и есть inference, инференс) на триллионе параметров к 2030 году должна упасть почти на 90% по сравнению с 2025-м. Цифры красивые, только они не отменяют простой математики. Когда AI-агент работает автономно часами, он жжёт токены пакетами, а не отдельными запросами, как обычный чат. Брайан Катанзаро из NVIDIA сказал это прямо: для его команды стоимость вычислений уже выше, чем зарплаты сотрудников.

Раджеш Джа из Microsoft формулирует цель открытым текстом: единый инструмент, который «Microsoft и GitHub могут глубоко настроить и которым владеют». GitHub Copilot CLI всё ещё будет включать модели Claude наряду с OpenAI, то есть формально партнёрство не рушится. По факту: даже у самого крупного корпоративного клиента Anthropic не сходится экономика AI-агентов. Если у Microsoft не сходится, у кого тогда сойдётся?

Huawei перепрокладывает провода вместо уменьшения транзисторов и обещает догнать TSMC к 2031

Huawei объявила Tau Scaling Law: закон масштабирования, по которому компания собирается выйти на эквивалент 1.4 нм к 2031 году. По заявлениям компании, на этих принципах за 6 лет уже разработан и серийно выпущен 381 чип для смартфонов и AI-вычислений. Следующая веха: линейка Kirin с архитектурой LogicFolding, релиз ожидается осенью 2026 года.

Идея в обход санкций простая. Геометрическая миниатюризация требует EUV-литографии от голландской ASML, а её Huawei купить не может. Tau Scaling Law вместо этого оптимизирует время прохождения сигнала внутри кристалла. Грубая аналогия: вместо того чтобы строить шоссе с большим количеством полос, Huawei перекладывает развязки. Машин столько же, но они быстрее доезжают.

Это собственный путь Китая в проектировании полупроводников: не реверс-инжиниринг TSMC, а альтернативный подход. Независимой верификации показателей пока нет, и центральный вопрос здесь не дизайн, а массовое производство. Кремний в реальном цеху всегда сложнее, чем дизайн на бумаге. История похожа на ставку из учебника: либо Huawei построила параллельный путь к топовым чипам, либо это красивая презентация для внутреннего рынка. Ответ покажет осень 2026 года, когда выйдут первые Kirin на LogicFolding.

Параллельно сюда добавляется следующая история. Если Tau Scaling Law работает хотя бы наполовину, у Huawei появляется фундамент под чипы Ascend следующих поколений. А на Ascend уже сегодня переехала DeepSeek.

ByteDance отдала бесплатно модель, которая делает работу облачных API

Lance: мультимодальная модель с 3 миллиардами активированных параметров, требует минимум 40 ГБ VRAM для локального запуска. Обучена на ~1 миллиарде пар изображение-текст и 140 миллионах пар видео-текст (1.5T токенов в pre-training). Бюджет на обучение: максимум 128 GPU. Бенчмарки: 0.90 на GenEval (совместно лучший среди унифицированных моделей), 85.11 на VBench, 7.30 на GEdit-Bench, 62.0 на MVBench. Лицензия Apache 2.0.

По-человечески: одна модель одновременно понимает картинки и видео, генерирует их и редактирует. До этого приходилось склеивать три отдельные модели для трёх задач, каждая со своим облачным счётом. Lance делает всё это локально на одной видеокарте уровня A100 или H100. Конкретный кейс: компания, которая раньше платила облачному провайдеру за обработку видео через API, может теперь поставить одну видеокарту и считать у себя.

Самое любопытное в этой истории: на чём обучали. 128 GPU - это в десятки и сотни раз меньше, чем тратили западные лаборатории на свои мультимодальные модели. ByteDance показывает, что граница для топовых результатов сдвигается вниз: не нужны бесконечные кластеры, нужна правильная архитектура. Mixture-of-Experts с двойным потоком и кодирование позиций, которое отделяет семантические токены от визуальных, это техническая суть, и она работает на скромном железе.

Apache 2.0 означает коммерческое использование без обязательств. Любой стартап может взять Lance, дообучить под себя и продавать продукт без отчислений ByteDance. Это удар по тому самому бизнесу, который Microsoft сегодня не может себе позволить: облачному инференсу с потоковым счётом за токены. Открытая модель не съест enterprise мгновенно, но смещает переговорную позицию: у клиента появляется аргумент «или вы режете цену, или мы ставим Lance на свой сервер».

Qwen 3.7 Max от Alibaba: суточный автономный запуск и Swaybench выше Opus 4.7 и GPT 5.5

Qwen 3.7 Max от Alibaba выполнил автономную задачу 35 часов подряд без вмешательства человека. Это не про скорость генерации и не про размер контекста, это про надёжность долгих агентных запусков. Превью модели запустили 14 мая 2026 года на Arena AI: в общем рейтинге Qwen 3.7 Max занял #13, по математике #7, в экспертных задачах #9. Alibaba впервые попала в шестёрку лучших AI-лабораторий по тексту.

Главное число другое. На Swaybench для долгосрочного кодирования Qwen 3.7 Max получил 60.6 и 8-е место в World of AI. По этому бенчмарку он обошёл Opus 4.7, GPT 5.5, Opus 4.6 и Gemini 3.1. В задачах, где агент должен держать контекст и логику много часов подряд, китайская модель сегодня впереди западных топов. Цена при этом $2.50 за миллион входных токенов и $7.50 за миллион выходных, доступ через чат и API с бесплатной регистрацией.

Стратегия Alibaba читается просто. Plus-вариант Qwen 3.7 будет открыт: для давления на рынок и экосистему. Max остаётся проприетарным: для денег. Двойной трек: один раздаёшь бесплатно, на другом зарабатываешь. Это тот же приём, который раньше отрабатывали Meta с Llama и Mistral, только в исполнении компании с собственным облаком Alibaba Cloud и своей агентной инфраструктурой.

35 часов автономной работы меняют ожидания рынка по простой причине. До этого «AI-агент» в корпоративном контракте означал «помощник, которого надо проверять каждые двадцать минут». Теперь у клиента возникает вопрос: если модель спокойно работает ночь и день без присмотра, можно ли вернуть бюджет на дежурного оператора?

DeepSeek слезает с NVIDIA: цены вниз, чипы Huawei на подходе

DeepSeek V4-Pro: 1.6 триллиона параметров, 49 миллиардов активируются на инференс. Лёгкая версия V4-Flash: 284 миллиарда параметров и 13 миллиардов активированных, контекстное окно 1 миллион токенов. Обе модели полностью адаптированы к чипам Huawei Ascend 950PR и 950DT. Главное в новости: day-0 адаптация одновременно достигнута для четырёх китайских производителей сразу: Huawei Ascend, Cambricon, Hygon и Moore Threads.

Day-0 совместимость означает, что флагманская модель работает на новом железе в день релиза, без месяцев портирования. До сих пор такой уровень поддержки имела только NVIDIA, потому что весь стек оптимизаций строился под CUDA. Теперь Китай впервые повторил это на флагмане одновременно для четырёх вендоров. Это не «можно запустить, если попотеть», это «работает из коробки на любом из четырёх».

DeepSeek с 23 мая 2026 года делает постоянным снижение цен на V4-Pro на 75%. Новые тарифы: 0.025-6 юаней за миллион токенов (~$0.0035-$0.83 в зависимости от типа использования), старые были 0.1-24 юаня. Компания назвала причину прямо: ожидается массовая доступность чипов Huawei Ascend 950 во втором полугодии 2026 года, и эта экономика закладывается в цены уже сейчас.

Связь с предыдущей историей лежит на поверхности. Huawei строит независимый чип-стек, DeepSeek первой переезжает на него своим флагманом, цены падают на 75%: отпала надбавка за NVIDIA. Microsoft в это же время режет бюджет агентов: западный AI-стек становится дороже, китайский дешевле и доступнее. Расходящиеся ножницы, и сегодня их видно по конкретным цифрам.

Препарат Eli Lilly показал потерю массы тела на уровне бариатрической хирургии

TRIUMPH-1, pivotal Phase 3 по ретатрутиду: 2339 рандомизированных участников, 532 в продлении, 80 недель основного исследования и 104 недели с расширением. На максимальной дозе 12 мг за 80 недель пациенты потеряли в среднем 70.3 фунта, или 28.3% массы тела. Плацебо за тот же период: 5.5 фунта или 2.2%. На дозе 9 мг минус 25.9%, на 4 мг минус 19.0%. При расширении до 104 недель пациенты с BMI ≥35 на дозе 12 мг сбросили 85.0 фунтов, или 30.3% массы. 45.3% участников группы 12 мг потеряли не меньше 30% веса, 65.3% вышли из категории ожирения (BMI <30).

Что такое ретатрутид. Это тройной агонист: препарат, который одновременно работает на трёх рецепторах. GLP-1 (тот самый класс, что в Ozempic и Wegovy, лекарствах от диабета и ожирения), GIP (как в Mounjaro) и глюкагон. До этого «потолком» индустрии был тирзепатид от той же Lilly. Ретатрутид показал результаты заметно выше. Ведущий исследователь Аниа Ястребофф формулирует осторожно: «Every dose of retatrutide resulted in clinically meaningful weight reduction for nearly all participants». Аналитики выражаются прямее. BMO Capital Markets называет препарат «новым шерифом в городе», Truist Securities, «новым бенчмарком для лекарств против ожирения».

Цифру, которую инвесторы будут читать внимательно, нужно искать в побочных эффектах. Дисестезия (неврологические ощущения покалывания и онемения) в группе 12 мг достигла 12.5%, отмена препарата 11.3%. Для сравнения: на дозе 4 мг отмена 4.1%, на плацебо 4.9%. То есть максимальная эффективность платится почти втрое более высоким отказом от лечения. FDA смотрит именно на такие соотношения.

Бариатрическая хирургия даёт сопоставимые цифры по потере веса, но это операция с госпитализацией и пожизненными ограничениями. Если ретатрутид доходит до одобрения с этими данными, рынок инъекционной медицины против ожирения снова переписывается. Тирзепатид (Mounjaro, Zepbound) уже изменил рынок препаратов от ожирения. Ретатрутид может оказаться следующей итерацией того же эффекта.

Microsoft режет Claude Code, потому что счёт за токены опередил выручку от агентов. DeepSeek в тот же день режет цены и пересаживается на Huawei. Если самый прибыльный заказчик AI-стека пересматривает экономику, а главный претендент на его кошелёк одновременно дешевеет и переезжает на независимый чип-стек, спор о том, кто платит за «новый класс интеллекта», окончательно сместился из презентаций в бюджетные таблицы.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Анализ

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Daily Digest - 24 мая 2026

Контроль над AI пытаются вернуть на четырёх уровнях за один день - и на каждом обнаруживают, что уже поздно.

·7 мин

Daily Digest - 23 мая 2026

OpenAI идёт на IPO с минусом, Anthropic отдаёт прибыль Маску за GPU, DeepSeek поднимает миллиарды под обещание не зарабатывать. Капиталу больше не нужна бизнес-модель.

·5 мин

DeepSeek режет цены на флагман V4-Pro на 75% — и это навсегда

DeepSeek объявила постоянное снижение цен на флагман V4-Pro на 75%. Новый уровень — от 0,025 до 6 юаней за миллион токенов.

·1 мин