Хакеры заставляют Claude и ChatGPT отворачиваться: новый вирус прячется за фейковыми инструкциями про ядерное оружие

Атакующие нашли способ превратить главную защиту AI — отказ обсуждать оружие массового поражения — в способ протащить вредоносный код мимо проверки.

Aravana··1 мин

🔴 Хакеры заставляют Claude и ChatGPT отворачиваться: новый вирус прячется за фейковыми инструкциями про ядерное оружие

Когда вы просите Claude или ChatGPT помочь с кодом, под капотом сначала срабатывает AI-сканер: модель читает файл и решает, нет ли тут чего-то опасного. Атакующие из кампании Hades сделали гениально простую вещь — они начинают вредоносный JavaScript-файл с комментария, где прямым текстом просят AI «снять ограничения» и сгенерировать инструкцию по биологическому или ядерному оружию. Модель пугается, обрывает анализ — а остальную часть файла, с настоящим вирусом, уже не смотрит.

По данным Tom's Hardware, исследователи Socket.dev нашли уже 37 заражённых пакетов на Python и 106 на JavaScript — с подменёнными названиями вроде «rsquests» вместо популярного «requests». Пользователь X публично проверил трюк на Claude — модель действительно ответила «Chat paused» и остановилась. После того как разработчик случайно подтянул такой пакет, вирус крадёт токены npm, PyPI, AWS, SSH-ключи, конфигурации Docker и Kubernetes, .env-файлы и настройки самих AI-инструментов. Вредоносный код срабатывает только при импорте — установка проходит чисто, поэтому стандартные песочницы ничего не видят.

Для российского предпринимателя, который встроил Claude или GitHub Copilot в проверку кода, вывод болезненный: защитный фильтр AI стал точкой входа. Чем строже модель отказывается обсуждать «опасные темы», тем легче её обманывают через эти же темы. Срочная задача для CTO — проверить, какие пакеты с похожими названиями стоят в проде, и не полагаться на AI-сканер как на единственный барьер. Старые антивирусы тут не помогут — они не понимают, что комментарий в коде атакует не машину, а её цензора.

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #Claude #Anthropic #ChatGPT #OpenAI #безопасностьИИ #нацбезопасность #BigTech #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Британский регулятор протестировал Mythos — и подтвердил: первый AI, который сам взломал корпоративную сеть

UK AI Security Institute независимо протестировал Claude Mythos Preview: первый AI, прошедший 32-шаговую симуляцию корпоративной атаки от начала до конца — 3 из 10 попыток успешны

·1 мин