Mistral выложил в открытый доступ модель, которая доказала 587 из 672 математических задач

Французская лаборатория раздаёт бесплатно модель, которая строго доказывает теоремы — и это первый класс задач, где ИИ работает без галлюцинаций.

Aravana··1 мин

🔴 Mistral выложил в открытый доступ модель, которая доказала 587 из 672 математических задач

Французская лаборатория Mistral редко мелькает в заголовках рядом с OpenAI и Google, но её новый ход бьёт точно в больное место всей отрасли. Компания выложила модель Leanstral 1.5, которая не рассуждает о математике словами, а строго доказывает теоремы. И раздаёт её бесплатно.

По данным MarkTechPost, Leanstral 1.5 решила 587 из 672 задач набора PutnamBench, университетских олимпиадных задач, где каждый шаг доказательства проверяет машина и подделать ответ невозможно. Одна задача обходится примерно в $4. Модель работает в среде формальных доказательств Lean 4, весит 119 миллиардов параметров, выложена под свободной лицензией Apache 2.0 и доступна через бесплатный интерфейс. На одном из тестов она обошла Claude Opus 4.6, а заодно нашла 5 незамеченных ошибок в 57 открытых проектах, включая критическую в одном из декодеров.

Здесь важна не сама математика, а принцип: формальное доказательство нельзя подделать — машина либо доказала, либо нет. Это первый класс задач, где ИИ выдаёт результат, которому можно доверять полностью, без выдумок. Для любого бизнеса, где цена ошибки высока (финансы, право, инженерия), сигнал прямой: проверяемый ИИ перестаёт быть теорией. А то, что мощнейший инструмент отдают даром, означает одно: порог входа в серьёзную разработку снова упал.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #агентыИИ #Mistral #Claude #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

За восемь месяцев AI на фрилансе стал справляться в шесть раз лучше

Новая модель Anthropic Fable 5 на бенчмарке 240 фриланс-заказов справилась не хуже профессионала в 16,1% случаев. Восемь месяцев назад лучший результат был 2,5%. Фронтир вырос в шесть раз.

·1 мин

За пять месяцев вдвое: голосовой ИИ стоит $22 млрд

Лондонский лидер голосового ИИ за пять месяцев подорожал вдвое: с $11 млрд в феврале до $22 млрд сейчас. При этом ни цента новых денег в компанию не поступит — это выкуп акций у сотрудников.

·1 мин

DeepSeek ускорил V4 почти вдвое и выложил код в открытый доступ

Китайская лаборатория опубликовала DSpark — приём, который заставляет DeepSeek-V4 отвечать на 60–85% быстрее без потери качества. Код под MIT.

·1 мин