DeepSeek ускорил V4 почти вдвое и выложил код в открытый доступ

Китайская лаборатория опубликовала DSpark — приём, который заставляет DeepSeek-V4 отвечать на 60–85% быстрее без потери качества. Код под MIT.

Aravana··1 мин

🔴 DeepSeek ускорил V4 почти вдвое и выложил код в открытый доступ

Пока конкуренты считают, на сколько ещё подрастут счета за GPU, китайцы взяли и разогнали свою флагманскую модель программно. Точность угадывания следующих токенов выросла с 45,7% до 95,7%: модель теперь почти не ошибается, когда пытается «предсказать саму себя».

Фреймворк называется DSpark. По данным MarkTechPost, в боевом режиме генерация DeepSeek-V4 ускоряется на 60–85% у Flash-версии и на 57–78% у Pro. Технически это так называемое спекулятивное декодирование: система прикручивает к модели лёгкий черновой модуль, который угадывает следующие слова пачкой, а главная модель только проверяет. Плюс умный планировщик: при низкой нагрузке на GPU проверяется больше токенов сразу, при высокой их становится меньше. Код выложен под лицензией MIT, веса доступны на Hugging Face. Это значит, что любой может встроить DSpark в свой продукт бесплатно.

Для российского предпринимателя смысл прямой: стоимость запуска AI-моделей продолжает падать быстрее, чем закладывают финмодели. Если вы строите сервис на LLM с открытым кодом, через квартал та же мощность будет обходиться вам ощутимо дешевле, а конкурент, который успеет переключиться раньше, получит маржу на ровном месте.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #DeepSeek #агентыИИ #чипы #GPU #инфраструктура #OpenAI #Anthropic #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Xiaomi выложила Miloco 2.0 в открытый доступ — умный дом получает свой JARVIS

Xiaomi открыла код Miloco 2.0 — мультимодальная система с памятью, идентификацией членов семьи и проактивными действиями, работающая на Mac mini.

·1 мин

Видеогенератор Маска обошёл Sora и стоит на 86% дешевле

xAI выпустила Grok Imagine Video 1.5 — модель возглавила Image-to-Video Arena и стоит на 86% дешевле Sora 2 от OpenAI.

·1 мин

Xiaomi выдал 1000 токенов в секунду — быстрее, чем вы успеваете читать этот абзац

Xiaomi MiMo V2.5 Pro в режиме UltraSpeed выдаёт 1000 токенов/сек на стандартных GPU, в 10 раз быстрее базового.

·1 мин