ChatGPT и Claude обыграли сертифицированный FDA медицинский AI
Nature Medicine: универсальные модели обошли OpenEvidence и UpToDate на трёх медицинских бенчмарках. Врачи тоже предпочли чат-боты.
🔴 ChatGPT и Claude обыграли сертифицированный FDA медицинский AI
Компании годами строили специализированные клинические AI-инструменты с регуляторной сертификацией, под надзором FDA, заточенные под врачей. А обычный ChatGPT берёт и обходит их на медицинских тестах. Свежее исследование в Nature Medicine зафиксировало это чёрным по белому.
Исследователи прогнали три передовые модели (GPT-5.2, Gemini 3.1 Pro и Claude Opus 4.6) против двух клинических AI-сервисов, OpenEvidence и UpToDate Expert AI. Три бенчмарка: 500 вопросов MedQA на медицинские знания, 500 заданий HealthBench на согласованность с врачами и 100 реальных клинических запросов от практикующих врачей. Универсальные модели победили во всех трёх. Сами врачи, читавшие ответы, тоже выбрали ChatGPT и его конкурентов чаще, чем «медицинский AI с сертификатом».
Для российского предпринимателя это маркер сдвига: специализированные продукты с дорогой регуляторной обвязкой проигрывают универсальным моделям, которые любой пользователь открывает в браузере бесплатно. FDA пока не определила, считать ли ChatGPT «системой поддержки клинических решений», и пока тянется этот вопрос, рынок медицинского софта уже перекраивается. Если вы строите вертикальный AI-продукт, главный вопрос: что у вас есть, кроме обёртки вокруг той же передовой модели.
Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.
#нейросети #LLM #ChatGPT #Claude #Gemini #OpenAI #Anthropic #Google #healthtech #FDA #биотех #регуляция #ИИ #технологии #AravanaAI
Хотите получать подобные материалы раньше?
Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.
Узнать про IntelligenceНе пропускайте важное
Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.
Bloomberg опубликовал письмо Латника, из-за которого Anthropic выключил Mythos
Bloomberg опубликовал копию письма министра торговли США Говарда Латника главе Anthropic Дарио Амодеи — приказ касается Mythos 5 и Fable 5, мотивировка про военную разведку Китая и России.
CNN подал в суд на Perplexity — и это уже девятый медиа-гигант в очереди
28 мая CNN присоединился к восьми другим издателям, обвиняющим Perplexity в краже 17 000 материалов и ложных указаниях на партнёрство.
ЕС официально смягчил AI Act — бизнес получил два лишних года
Совет и Парламент ЕС договорились отодвинуть требования к high-risk AI системам с 2 августа 2026 на 2 декабря 2027 года, ввести запрет на nudifier-приложения и сократить административную нагрузку для малого бизнеса.