DeepSeek ускорил V4 почти вдвое и выложил код в открытый доступ
Китайская лаборатория опубликовала DSpark — приём, который заставляет DeepSeek-V4 отвечать на 60–85% быстрее без потери качества. Код под MIT.
🔴 DeepSeek ускорил V4 почти вдвое и выложил код в открытый доступ
Пока конкуренты считают, на сколько ещё подрастут счета за GPU, китайцы взяли и разогнали свою флагманскую модель программно. Точность угадывания следующих токенов выросла с 45,7% до 95,7%: модель теперь почти не ошибается, когда пытается «предсказать саму себя».
Фреймворк называется DSpark. По данным MarkTechPost, в боевом режиме генерация DeepSeek-V4 ускоряется на 60–85% у Flash-версии и на 57–78% у Pro. Технически это так называемое спекулятивное декодирование: система прикручивает к модели лёгкий черновой модуль, который угадывает следующие слова пачкой, а главная модель только проверяет. Плюс умный планировщик: при низкой нагрузке на GPU проверяется больше токенов сразу, при высокой их становится меньше. Код выложен под лицензией MIT, веса доступны на Hugging Face. Это значит, что любой может встроить DSpark в свой продукт бесплатно.
Для российского предпринимателя смысл прямой: стоимость запуска AI-моделей продолжает падать быстрее, чем закладывают финмодели. Если вы строите сервис на LLM с открытым кодом, через квартал та же мощность будет обходиться вам ощутимо дешевле, а конкурент, который успеет переключиться раньше, получит маржу на ровном месте.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
#нейросети #LLM #модели #DeepSeek #агентыИИ #чипы #GPU #инфраструктура #OpenAI #Anthropic #ИИ #технологии #AravanaAI
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.