7 апреля министр финансов США Скотт Бессент и глава Федеральной резервной системы Джером Пауэлл созвали экстренное совещание с руководителями Citigroup, Morgan Stanley, Bank of America, Wells Fargo и Goldman Sachs. Причиной стала не взлом и не утечка данных — а публичное объявление о новой модели искусственного интеллекта.
Что такое Mythos и почему его еще нет у вас
Anthropic объявила об инициативе Project Glasswing на базе Claude Mythos Preview — модели, которая способна автономно выявлять уязвимости программного обеспечения в масштабе. Доступ к ней получили только избранные: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Широкой публики среди них нет.
Claude Mythos2 Preview — универсальная модель, которая еще не выпущена, но демонстрирует неудобный факт: ИИ достиг уровня, когда превосходит всех, кроме наиболее квалифицированных людей, в поиске и эксплуатации уязвимостей.
«Мы не обучали Mythos Preview этим возможностям намеренно. Они возникли как побочный результат общего улучшения кода, рассуждений и автономности»
— Anthropic, технический отчет Project Glasswing
Другими словами: модель научилась взламывать системы, тренируясь писать лучший код.
Что конкретно она уже сделала
За несколько недель Mythos Preview идентифицировал тысячи zero-day уязвимостей — ранее неизвестных разработчикам — в каждой крупной операционной системе и каждом крупном браузере, а также в ряде другого критического программного обеспечения.
Каждый из документированных эксплойтов был написан полностью автономно, без какого-либо вмешательства человека после первоначального запроса. Mythos получил список из 100 CVE и известных уязвимостей ядра Linux и самостоятельно отобрал 40 потенциально пригодных для эксплуатации.
Более 99% найденных уязвимостей еще не исправлены, поэтому их публичное раскрытие Anthropic считает безответственным. Модель, которая знает где «дыры», не выпускается в сеть — но детали о ней уже утекали ранее через человеческую ошибку при хранении данных в публично доступном кеше.
Логика Anthropic: атаковать первыми, чтобы защититься
Project Glasswing — это «экстренная попытка» использовать возможности передовой модели для защиты до того, как аналогичные возможности получат враждебно настроенные субъекты. Anthropic выделяет до $100 млн в виде кредитов на использование модели и $4 млн прямых пожертвований организациям с открытым кодом в сфере безопасности.
Есть и чисто прагматический аргумент в пользу такой логики: те же возможности, которые делают ИИ-модели опасными в чужих руках, делают их бесценными для поиска и исправления уязвимостей в критическом программном обеспечении.
- Защитники получили преимущество сейчас — но временное: возможности передовых моделей, вероятно, существенно возрастут уже в течение следующих нескольких месяцев.
- Банковская система — среди приоритетных целей: именно поэтому Минфин собрал CEO, а не технических директоров.
- Открытый код — самое слабое звено: open source составляет подавляющее большинство кода в современных системах, включая те, которые используют сами ИИ-агенты для написания нового программного обеспечения.
Вопрос не в том, найдет ли кто-то эти уязвимости. Anthropic уже нашел. Вопрос в том, успеют ли исправить 99% открытых дыр до того, как аналогичная модель окажется в руках того, кто не будет созывать совещания с банкирами, а сразу перейдет к действию — и по какой цене произойдет первая атака, если этого не произойдет.