Google вырвался вперёд: Gemini 3 обогнал Claude и GPT на главных тестах

Google DeepMind выпустил линейку Gemini 3 из пяти моделей. На ключевых тестах на способность рассуждать новинка опередила Claude Opus 4.6 и GPT-5.2.

Aravana··1 мин

🔴 Google вырвался вперёд: Gemini 3 обогнал Claude и GPT на главных тестах

Google DeepMind выкатил Gemini 3 — линейку из пяти моделей: Pro, Flash, 3.1 Pro, Flash-Lite и Deep Think. Позиционируется как самая умная AI-модель на рынке.

Цифры, которые меняют расклад в гонке: • На Humanity's Last Exam (один из самых жёстких тестов на способность рассуждать) Gemini 3.1 Pro набрал 44,4% — против 40,0% у Opus 4.6 и 34,5% у GPT-5.2 • На ARC-AGI-2 (тест на абстрактное мышление) — 77,1% против 68,8% у Opus и 52,9% у GPT-5.2 • На SWE-Bench Verified (написание кода) — 80,6%

Вице-президент GitHub отдельно отметил: Gemini 3 Pro решает программистские задачи на 35% точнее предыдущей версии 2.5 Pro. В JetBrains говорят про более чем 50% улучшение в количестве решённых тестовых задач.

Это серьёзная заявка: впервые за долгое время Google объективно опережает Anthropic и OpenAI сразу на нескольких ключевых тестах на мышление. Гонка снова открыта.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Genesis AI представила робота Eno — без ног, но со своей AI-моделью

Genesis AI при $105 млн инвестиций выпустила Eno — колёсного универсального робота на собственной модели GENE

·1 мин

Европарламент отодвинул главные требования AI Act на 2027 — компании выдохнули

Европарламент 423 голосами против 57 отодвинул требования к high-risk AI на декабрь 2027 и запретил nudifier-приложения

·1 мин

ChatGPT перешагнул миллиард пользователей в месяц быстрее, чем любое приложение в истории

OpenAI добил отметку 1 млрд MAU в мае 2026 — три года с запуска, рекорд скорости. Параллельно — рост недоверия к AI у американцев.

·1 мин