Google вырвался вперёд: Gemini 3 обогнал Claude и GPT на главных тестах

Google DeepMind выпустил линейку Gemini 3 из пяти моделей. На ключевых тестах на способность рассуждать новинка опередила Claude Opus 4.6 и GPT-5.2.

Aravana··1 мин

🔴 Google вырвался вперёд: Gemini 3 обогнал Claude и GPT на главных тестах

Google DeepMind выкатил Gemini 3 — линейку из пяти моделей: Pro, Flash, 3.1 Pro, Flash-Lite и Deep Think. Позиционируется как самая умная AI-модель на рынке.

Цифры, которые меняют расклад в гонке: • На Humanity's Last Exam (один из самых жёстких тестов на способность рассуждать) Gemini 3.1 Pro набрал 44,4% — против 40,0% у Opus 4.6 и 34,5% у GPT-5.2 • На ARC-AGI-2 (тест на абстрактное мышление) — 77,1% против 68,8% у Opus и 52,9% у GPT-5.2 • На SWE-Bench Verified (написание кода) — 80,6%

Вице-президент GitHub отдельно отметил: Gemini 3 Pro решает программистские задачи на 35% точнее предыдущей версии 2.5 Pro. В JetBrains говорят про более чем 50% улучшение в количестве решённых тестовых задач.

Это серьёзная заявка: впервые за долгое время Google объективно опережает Anthropic и OpenAI сразу на нескольких ключевых тестах на мышление. Гонка снова открыта.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Meta купила робототехнический стартап — Цукерберг идёт за телом для своих гуманоидов

Meta поглощает Assured Robot Intelligence — стартап, обучающий гуманоидов двигаться. Подразделение Superintelligence Labs закрывает ключевой пробел в собственном человекоподобном роботе и официально входит в гонку с Tesla, Figure и 1X.

·1 мин

AI обыграл врачей в приёмном покое — и Гарвард опубликовал это в Science

76 реальных случаев из бостонской больницы, слепое сравнение, три стадии — и AI лучше людей особенно там, где данных меньше всего: на первом контакте с пациентом.

·1 мин

Чтобы остановить Huawei, США перекрыли станки для совсем другой компании

Минторг США приказал Lam Research, Applied Materials и KLA остановить поставки в Hua Hong — второго чипмейкера Китая. Hua Hong готовилась запустить 7-нм производство к концу 2026.

·1 мин