NVIDIA выпустила одну модель, которая внутри одновременно три — 30B, 23B и 12B

NVIDIA Star Elastic: одно семейство reasoning-моделей в одном чекпоинте, экономия 360x на обучении и работа на consumer GPU.

Aravana··1 мин

🔴 NVIDIA выпустила одну модель, которая внутри одновременно три — 30B, 23B и 12B

NVIDIA показала Star Elastic — модель для рассуждений нового типа: один файл весов, из которого без дообучения можно вытащить версию на 30, 23 или 12 миллиардов параметров.

Раньше каждый размер модели тренировали отдельно — каждая версия требовала своих GPU-часов и денег. Star Elastic складывает все три внутрь одной — поменьше «прячутся» в большой и переиспользуют её самые важные веса. NVIDIA заявляет 360-кратную экономию токенов на тренировку по сравнению с обычным подходом. Версия на 23B обходит Qwen3-30B на тесте AIME-2025 — 85,63 против 80,00. Если запускать 23B для размышлений и 30B для финального ответа, точность растёт на 16 процентов, задержка падает почти вдвое. Сжатая в формат FP4 модель на 30B весит 18,7 ГБ — её 12B-версия запускается на потребительских видеокартах, где обычная просто не помещается.

Для российского предпринимателя это сигнал о том, куда идёт стоимость запуска AI-моделей. До сих пор выбор был жёстким: качество против цены. Теперь одна модель умеет подстраиваться под бюджет на лету — и это меняет экономику AI-сервисов. Те, кто запускают LLM локально или строят продукты с дорогими токенами, в ближайший год получат варианты дешевле и быстрее.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #NVIDIA #GPU #чипы #H100 #агентыИИ #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Meta убрала Ray-Ban с обложки и выкатила свои AI-очки за $299

Цукерберг впервые выпустил AI-очки под собственным брендом — за $299, на собственной модели Muse Spark и без EssilorLuxottica.

·1 мин

Cursor показал собственную модель, свой Git и мобильное приложение

После покупки SpaceX за $60 млрд Cursor выкатил собственную модель уровня Opus, новую Git-платформу Origin и мобильное приложение для iOS.

·1 мин

NVIDIA выпустила агентов, которые сами придумают и проверят новое лекарство

На BIO 2026 NVIDIA представила BioNeMo agent toolkit — агенты для drug discovery, которые сами строят гипотезы и связывают шаги в цепочки.

·1 мин