Anthropic навмисно не випускає свій найпотужніший ШІ у відкритий доступ — і саме це насторожує фінансистів

Claude Mythos самостійно знайшов тисячі критичних вразливостей у кожній великій операційній системі та браузері. Anthropic це визнає, але стверджує, що модель утримується заради захисту — а не атаки.

397
Поділиться:
Міністр фінансів США Скотт Бессент (Фото: EPA / Allison Robbert)

7 квітня міністр фінансів США Скотт Бессент і голова Федеральної резервної системи Джером Пауелл скликали термінову зустріч із керівниками Citigroup, Morgan Stanley, Bank of America, Wells Fargo та Goldman Sachs. Приводом став не злам і не витік даних — а публічне оголошення про нову модель штучного інтелекту.

Що таке Mythos і чому він ще не у вас

Anthropic оголосила ініціативу Project Glasswing на базі Claude Mythos Preview — моделі, яка здатна автономно виявляти вразливості програмного забезпечення у масштабі. Доступ до неї отримали лише обрані: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA та Palo Alto Networks. Широкої публіки серед них немає.

Claude Mythos2 Preview — загальна модель, яка ще не випущена, але демонструє незручний факт: ШІ досяг рівня, коли перевершує всіх, крім найкваліфікованіших людей, у пошуку та експлуатації вразливостей.

«Ми не навчали Mythos Preview цих можливостей навмисно. Вони виникли як побічний наслідок загального покращення коду, міркування та автономності»

— Anthropic, технічний звіт Project Glasswing

Іншими словами: модель навчилась зламувати системи, тренуючись писати кращий код.

Що конкретно вона вже зробила

За кілька тижнів Mythos Preview ідентифікував тисячі zero-day вразливостей — раніше невідомих розробникам — у кожній великій операційній системі та кожному великому браузері, а також у низці іншого критичного програмного забезпечення.

Кожен із задокументованих експлойтів був написаний повністю автономно, без жодного втручання людини після початкового запиту. Mythos отримав список із 100 CVE та відомих вразливостей ядра Linux і самостійно відібрав 40 потенційно придатних для експлуатації.

Понад 99% знайдених вразливостей ще не виправлені, тому їх публічне розкриття Anthropic вважає безвідповідальним. Модель, яка знає де «дірки», не випускається до мережі — але деталі про неї вже витікали раніше через людську помилку при зберіганні даних у публічно доступному кеші.

Логіка Anthropic: атакувати першими, щоб захиститись

Project Glasswing — це «термінова спроба» використати можливості фронтирної моделі для захисту до того, як аналогічні можливості отримають вороже налаштовані актори. Anthropic виділяє до $100 млн у вигляді кредитів на використання моделі та $4 млн прямих донацій організаціям з відкритим кодом у сфері безпеки.

Є й суто прагматичний аргумент на користь такої логіки: ті самі можливості, що роблять ШІ-моделі небезпечними в чужих руках, роблять їх безцінними для пошуку й виправлення вразливостей у критичному програмному забезпеченні.

  • Захисники отримали перевагу зараз — але тимчасову: можливості фронтирних моделей, ймовірно, суттєво зростуть уже впродовж наступних кількох місяців.
  • Банківська система — серед пріоритетних цілей: саме тому Мінфін зібрав CEO, а не технічних директорів.
  • Відкритий код — найслабша ланка: open source складає переважну більшість коду в сучасних системах, включно з тими, які використовують самі ШІ-агенти для написання нового програмного забезпечення.

Питання не в тому, чи знайде хтось ці вразливості. Anthropic вже знайшов. Питання в тому, чи встигнуть виправити 99% незакритих дірок до того, як аналогічна модель опиниться в руках того, хто не скликатиме зустрічей із банкірами, а одразу перейде до дії — і за якого рахунку відбудеться перша атака, якщо цього не станеться.

Новини світу

Політика

Французька дипломатія в кращих традиціях короля-Сонце: під час саміту G7 Макрон нагадав Трампу, що незалежність США 250 років тому врятувала саме Франція — і зробив це велично, у золоті Версаля.

2 дні тому
Культура

Пошкоджено майже 4500 об'єктів — від сільських клубів до пам'яток ЮНЕСКО. Міністерка культури Бережна вперше публічно назвала непрямі збитки: вони у шість разів перевищують прямі.

4 дні тому
Війна

Організація верифікувала понад 340 пошкоджених об'єктів культурної спадщини України, але в офіційних формулюваннях не називає виконавця атак. Міністерка культури Бережна вимагає змінити цю практику — і за нею стоїть ціла дипломатична логіка.

4 дні тому