Anthropic намеренно не выпускает свой самый мощный ИИ в открытый доступ — и именно это настораживает финансистов

Claude Mythos самостоятельно обнаружил тысячи критических уязвимостей в каждой крупной операционной системе и браузере. Anthropic это признает, но утверждает, что модель сдерживается в целях защиты — а не атаки.

395
Поделиться:
Міністр фінансів США Скотт Бессент (Фото: EPA / Allison Robbert)

7 апреля министр финансов США Скотт Бессент и глава Федеральной резервной системы Джером Пауэлл созвали экстренное совещание с руководителями Citigroup, Morgan Stanley, Bank of America, Wells Fargo и Goldman Sachs. Причиной стала не взлом и не утечка данных — а публичное объявление о новой модели искусственного интеллекта.

Что такое Mythos и почему его еще нет у вас

Anthropic объявила об инициативе Project Glasswing на базе Claude Mythos Preview — модели, которая способна автономно выявлять уязвимости программного обеспечения в масштабе. Доступ к ней получили только избранные: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Широкой публики среди них нет.

Claude Mythos2 Preview — универсальная модель, которая еще не выпущена, но демонстрирует неудобный факт: ИИ достиг уровня, когда превосходит всех, кроме наиболее квалифицированных людей, в поиске и эксплуатации уязвимостей.

«Мы не обучали Mythos Preview этим возможностям намеренно. Они возникли как побочный результат общего улучшения кода, рассуждений и автономности»

— Anthropic, технический отчет Project Glasswing

Другими словами: модель научилась взламывать системы, тренируясь писать лучший код.

Что конкретно она уже сделала

За несколько недель Mythos Preview идентифицировал тысячи zero-day уязвимостей — ранее неизвестных разработчикам — в каждой крупной операционной системе и каждом крупном браузере, а также в ряде другого критического программного обеспечения.

Каждый из документированных эксплойтов был написан полностью автономно, без какого-либо вмешательства человека после первоначального запроса. Mythos получил список из 100 CVE и известных уязвимостей ядра Linux и самостоятельно отобрал 40 потенциально пригодных для эксплуатации.

Более 99% найденных уязвимостей еще не исправлены, поэтому их публичное раскрытие Anthropic считает безответственным. Модель, которая знает где «дыры», не выпускается в сеть — но детали о ней уже утекали ранее через человеческую ошибку при хранении данных в публично доступном кеше.

Логика Anthropic: атаковать первыми, чтобы защититься

Project Glasswing — это «экстренная попытка» использовать возможности передовой модели для защиты до того, как аналогичные возможности получат враждебно настроенные субъекты. Anthropic выделяет до $100 млн в виде кредитов на использование модели и $4 млн прямых пожертвований организациям с открытым кодом в сфере безопасности.

Есть и чисто прагматический аргумент в пользу такой логики: те же возможности, которые делают ИИ-модели опасными в чужих руках, делают их бесценными для поиска и исправления уязвимостей в критическом программном обеспечении.

  • Защитники получили преимущество сейчас — но временное: возможности передовых моделей, вероятно, существенно возрастут уже в течение следующих нескольких месяцев.
  • Банковская система — среди приоритетных целей: именно поэтому Минфин собрал CEO, а не технических директоров.
  • Открытый код — самое слабое звено: open source составляет подавляющее большинство кода в современных системах, включая те, которые используют сами ИИ-агенты для написания нового программного обеспечения.

Вопрос не в том, найдет ли кто-то эти уязвимости. Anthropic уже нашел. Вопрос в том, успеют ли исправить 99% открытых дыр до того, как аналогичная модель окажется в руках того, кто не будет созывать совещания с банкирами, а сразу перейдет к действию — и по какой цене произойдет первая атака, если этого не произойдет.

Новости мира

Политика

Французская дипломатия в лучших традициях короля-Солнца: во время саммита G7 Макрон напомнил Трампу, что независимость США 250 лет назад спасла именно Франция — и сделал это величественно, в золотых покоях Версаля.

2 дня назад
Культура

Повреждено почти 4500 объектов — от сельских клубов до памятников ЮНЕСКО. Министр культуры Бережная впервые публично назвала косвенные убытки: они в шесть раз превышают прямые.

4 дня назад
Война

Организация верифицировала более 340 поврежденных объектов культурного наследия Украины, но в официальных формулировках не называет исполнителя атак. Министр культуры Береженая требует изменить эту практику — и за ней стоит целая дипломатическая логика.

4 дня назад