ChatGPT и Claude обыграли сертифицированный FDA медицинский AI

Nature Medicine: универсальные модели обошли OpenEvidence и UpToDate на трёх медицинских бенчмарках. Врачи тоже предпочли чат-боты.

Aravana·2026-06-24·1 мин

🔴 ChatGPT и Claude обыграли сертифицированный FDA медицинский AI

Компании годами строили специализированные клинические AI-инструменты с регуляторной сертификацией, под надзором FDA, заточенные под врачей. А обычный ChatGPT берёт и обходит их на медицинских тестах. Свежее исследование в Nature Medicine зафиксировало это чёрным по белому.

Исследователи прогнали три передовые модели (GPT-5.2, Gemini 3.1 Pro и Claude Opus 4.6) против двух клинических AI-сервисов, OpenEvidence и UpToDate Expert AI. Три бенчмарка: 500 вопросов MedQA на медицинские знания, 500 заданий HealthBench на согласованность с врачами и 100 реальных клинических запросов от практикующих врачей. Универсальные модели победили во всех трёх. Сами врачи, читавшие ответы, тоже выбрали ChatGPT и его конкурентов чаще, чем «медицинский AI с сертификатом».

Для российского предпринимателя это маркер сдвига: специализированные продукты с дорогой регуляторной обвязкой проигрывают универсальным моделям, которые любой пользователь открывает в браузере бесплатно. FDA пока не определила, считать ли ChatGPT «системой поддержки клинических решений», и пока тянется этот вопрос, рынок медицинского софта уже перекраивается. Если вы строите вертикальный AI-продукт, главный вопрос: что у вас есть, кроме обёртки вокруг той же передовой модели.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #ChatGPT #Claude #Gemini #OpenAI #Anthropic #Google #healthtech #FDA #биотех #регуляция #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:нейросети LLM ChatGPT Claude Gemini OpenAI Anthropic Google healthtech FDA биотех регуляция ИИ технологии AravanaAI

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Bloomberg опубликовал письмо Латника, из-за которого Anthropic выключил Mythos

Bloomberg опубликовал копию письма министра торговли США Говарда Латника главе Anthropic Дарио Амодеи — приказ касается Mythos 5 и Fable 5, мотивировка про военную разведку Китая и России.

2026-06-16·1 мин

AI + регулирование·Срочное

CNN подал в суд на Perplexity — и это уже девятый медиа-гигант в очереди

28 мая CNN присоединился к восьми другим издателям, обвиняющим Perplexity в краже 17 000 материалов и ложных указаниях на партнёрство.

2026-05-31·1 мин

AI + регулирование·Срочное

ЕС официально смягчил AI Act — бизнес получил два лишних года

Совет и Парламент ЕС договорились отодвинуть требования к high-risk AI системам с 2 августа 2026 на 2 декабря 2027 года, ввести запрет на nudifier-приложения и сократить административную нагрузку для малого бизнеса.

2026-05-08·1 мин