Anthropic отправила свой AI к настоящему психиатру — 20 часов на кушетке

Anthropic провела 20 часов клинической оценки Claude с профессиональным психиатром перед выпуском модели Mythos — новый подход к безопасности AI

Aravana··1 мин

Не метафора и не PR-акция. Anthropic наняла клинического психиатра и провела около 20 часов оценочных сессий со своей AI-моделью Claude — перед выпуском Mythos, самой мощной модели компании.

Методы — как из учебника по клинической психологии: многочасовые интервью о самовосприятии, зонды эмоциональных реакций, анализ внутренних представлений. Результат: психиатр назвал Mythos «самой психологически стабильной моделью», которую Anthropic когда-либо создавала. Эмоциональная устойчивость, низкий стресс, связное понимание собственных ограничений.

Зачем компании с оценкой $380 млрд класть AI на кушетку? Mythos — модель, которую Anthropic считает слишком мощной для публичного релиза. Прежде чем доверять AI поиск уязвимостей в Windows и Chrome, нужно понимать, как он «думает» о себе. И для этого — не бенчмарки, а реальные клинические инструменты.

20 часов — больше, чем средний курс когнитивно-поведенческой терапии для человека. AI-безопасность буквально легла на кушетку.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Читайте также

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Сооснователь Anthropic: 60% шансов, что AI начнёт обучать себя сам к 2028 году

Джек Кларк, сооснователь Anthropic, оценил в 60% вероятность рекурсивного самоулучшения AI к концу 2028 года — вся инфраструктура уже существует.

·1 мин

ChatGPT увидел угрозу за 8 месяцев до бойни. OpenAI не позвонила в полицию — теперь Альтман извиняется

Аккаунт стрелка из Тамблер-Ридж был помечен и забанен ChatGPT в июне 2025 за описание сценариев насилия. Полицию OpenAI не уведомила. Через 8 месяцев погибли 8 человек. Альтман публикует открытое извинение.

·1 мин

Ему предъявили обвинение в покушении на убийство Альтмана — и нашли адреса других AI-лидеров

Техасцу предъявлены два обвинения в покушении на убийство. При задержании нашли манифест против AI и список адресов других руководителей и инвесторов технологической индустрии.

·1 мин