Маленькая модель IBM на 3 млрд параметров обогнала GPT-4o на работе с графиками

MIT и IBM Research выпустили датасет ChartNet — на нём модель Granite 4.0 в десятки раз меньше GPT-4o обходит её по всем задачам на графиках.

Aravana··1 мин

🔴 Маленькая модель IBM на 3 млрд параметров обогнала GPT-4o на работе с графиками

Если вы платите OpenAI за то, чтобы их модель доставала цифры из ваших панелей мониторинга и квартальных отчётов — у вас появляется альтернатива, которая работает на вашем сервере без счёта за API. Исследователи MIT и IBM Research выпустили датасет ChartNet и обученную на нём модель, которая по всем задачам с графиками обгоняет модели «на порядок больше», включая GPT-4o.

По материалу Tech Times, ChartNet содержит 1,7 миллиона синтетических примеров плюс 632 тысячи цепочек рассуждений, 94 тысячи примеров с человеческой проверкой и 30 тысяч реальных графиков. На этом датасете модель IBM Granite 4.0 3B Vision на 3 миллиарда параметров показала 86,4% точности в задаче «график → краткое описание» и 62,1% в задаче «график → таблица». Ведущий автор — аспирантка MIT Йована Кондич, соавтор — старший научный сотрудник IBM Research Дхирадж Джоши. Работа представлена 4 июня на конференции CVPR 2026 в Денвере.

Для бизнеса главный вывод не про красивые проценты, а про экономику. Модель в 3 миллиарда параметров запускается на обычном корпоративном железе — никакого облачного API, никакой поштучной оплаты запросов, никакой утечки чувствительных финансовых данных наружу. Если у вас есть процесс, который ежедневно пропускает через GPT-4o графики из отчётов поставщиков, панелей мониторинга или клиентских презентаций, — это первый звонок переходить на локальные модели. Стоимость владения может упасть в десятки раз, а скорость отклика — вырасти.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #мультимодальность #ChatGPT #OpenAI #productivitytools #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.