Google вырвался вперёд: Gemini 3 обогнал Claude и GPT на главных тестах

Google DeepMind выпустил линейку Gemini 3 из пяти моделей. На ключевых тестах на способность рассуждать новинка опередила Claude Opus 4.6 и GPT-5.2.

Aravana·2026-05-03·1 мин

🔴 Google вырвался вперёд: Gemini 3 обогнал Claude и GPT на главных тестах

Google DeepMind выкатил Gemini 3 — линейку из пяти моделей: Pro, Flash, 3.1 Pro, Flash-Lite и Deep Think. Позиционируется как самая умная AI-модель на рынке.

Цифры, которые меняют расклад в гонке: • На Humanity's Last Exam (один из самых жёстких тестов на способность рассуждать) Gemini 3.1 Pro набрал 44,4% — против 40,0% у Opus 4.6 и 34,5% у GPT-5.2 • На ARC-AGI-2 (тест на абстрактное мышление) — 77,1% против 68,8% у Opus и 52,9% у GPT-5.2 • На SWE-Bench Verified (написание кода) — 80,6%

Вице-президент GitHub отдельно отметил: Gemini 3 Pro решает программистские задачи на 35% точнее предыдущей версии 2.5 Pro. В JetBrains говорят про более чем 50% улучшение в количестве решённых тестовых задач.

Это серьёзная заявка: впервые за долгое время Google объективно опережает Anthropic и OpenAI сразу на нескольких ключевых тестах на мышление. Гонка снова открыта.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Пост из Telegram

Поделиться:Telegram X LinkedIn

Как вам материал?

Daily Digest - 31 июля 2026

ИИ-инвесторы больше не покупают обещания: платят только тем, у кого капзатраты уже стали строкой в выручке.

2026-07-31·8 мин

AI·Ежедневный обзор

Daily Digest - 29 июля 2026

Nvidia ручается за долги покупателей, Meta отдала стройку фонду, регулятор закрыл рынок роботов, а инженеры просят притормозить их же отрасль - риск нигде не исчез, он поменял владельца.

2026-07-29·6 мин

AI·Ежедневный обзор

Daily Digest - 28 июля 2026

AI-индустрия уступает сразу по нескольким фронтам: доверие, безопасность, чипы, оценка. Только Apple, ничего не обещавшая про AI, снова номер один.

2026-07-28·6 мин