ByteDance нашла способ продлить бум ИИ, когда закончатся данные

Запас данных для обучения моделей близок к исчерпанию. ByteDance предлагает другой путь: ИИ, который учится на собственном опыте после запуска.

Aravana··1 мин

🔴 ByteDance нашла способ продлить бум ИИ, когда закончатся данные

Вся индустрия ИИ последние годы росла по простой формуле: чем больше данных и вычислительной мощности, тем умнее модель. Проблема в том, что данные заканчиваются: запас публичного человеческого текста, на котором учатся модели, близок к исчерпанию. Владелец TikTok, похоже, нашёл обходной путь.

По данным South China Morning Post, команда ByteDance Seed опубликовала работу с неожиданным выводом: ИИ-агенты способны удваивать скорость обучения каждые три месяца, если продолжают учиться на реальных задачах уже после запуска, а не только на заранее собранном наборе текстов. Чтобы это измерить, компания создала тест EdgeBench: 134 сверхдлинные задачи из программирования, научных исследований, математики и экспертной работы, каждая требует минимум 12 часов непрерывной работы агента.

Если верна старая формула «данные закончились, прогресс встал», весь рынок ждёт потолок. ByteDance описывает другую траекторию: модель набирается ума не из архива текстов, а из собственного опыта, как сотрудник, который растёт в мастерстве прямо на работе. Для бизнеса это значит, что ИИ-агент, которого вы внедряете сегодня, способен становиться сильнее сам по себе, не дожидаясь новой большой модели от лаборатории.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #агентыИИ #модели #исследования #Китай #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Маленькая модель IBM на 3 млрд параметров обогнала GPT-4o на работе с графиками

MIT и IBM Research выпустили датасет ChartNet — на нём модель Granite 4.0 в десятки раз меньше GPT-4o обходит её по всем задачам на графиках.

·1 мин