1 000 чипов Huawei дотянули модель на 1,6 трлн параметров — без единого GPU NVIDIA

Команда из Huawei и трёх шэньчжэньских институтов отчиталась о полнопараметровом пост-тренинге модели DeepSeek на 1,6 трлн параметров — впервые на 1 000 китайских чипов Ascend 910C без единого GPU NVIDIA. DeepSeek результат пока не подтвердил.

Aravana··1 мин

🔴 1 000 чипов Huawei дотянули модель на 1,6 трлн параметров — без единого GPU NVIDIA

Китайская группа исследователей отчиталась о завершении полного дообучения модели DeepSeek на 1,6 трлн параметров. Всё считалось на 1 000 китайских чипов Huawei Ascend 910C. Год назад те же чипы, по сообщениям, не могли пройти ни одного полного обучающего цикла — теперь работа закончена.

Важный нюанс: это не обучение с нуля, а финальная стадия — дообучение уже готовой модели. Это более лёгкая задача, чем обучение фундаментальной модели от нуля, на которое всё ещё нужны кластеры Blackwell. Сам DeepSeek официально результаты не подтвердил, бенчмарков, длительности и сравнений с NVIDIA в отчёте нет. В команду вошли Huawei Technologies, шэньчжэньский Loop Area Institute, шэньчжэньский кампус Харбинского технологического института и Шэньчжэньский исследовательский институт больших данных.

Для рынка это сигнал: США два года выстраивали экспортный контроль, чтобы отрезать Китай от продвинутых чипов, — а Китай в это время методично двигался по своей кривой. Полный отказ от NVIDIA пока невозможен, но «дообучить» крупную модель на отечественном железе уже реально. Для российского предпринимателя это значит, что в 2027 году появятся китайские облака с обучением на Ascend по ценам, которые западные провайдеры даже не попытаются повторить.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#чипы #нейропроцессоры #Huawei #DeepSeek #чиповаявойна #геополитика #экспортный_контроль #Китай #США #нейросети #LLM #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

TSMC второй раз за год задирает цены на самые передовые чипы — расплачиваться будут все

TSMC поднимает цены на 3-нанометровые чипы на 15% во втором полугодии 2026 и ещё на 5–10% в 2027 — второе повышение за год при дефиците мощностей до 2027.

·1 мин