У 2024 році Apple представила iPhone 16 як пристрій, створений для нового покоління Siri. Рік потому голосовий помічник так і не отримав заявлених функцій. У березні 2025-го компанія публічно визнала затримку — через п'ять місяців після старту продажів.
Що пішло не так всередині
За даними джерел 9to5Mac і The Information, інженери Apple зіткнулися з фундаментальною проблемою архітектури: інтеграція нової AI-системи зі старою платформою Siri потроїла частоту помилок. Це змусило компанію фактично переписувати помічника з нуля. Джон Джаннандреа, старший віцепрезидент з AI, втратив контроль над споживчими продуктами — його роль звузилася до досліджень. Robby Walker, старший директор команди Siri, залишив Apple після того, як його промова на внутрішній нараді — де він порівняв незавершений проєкт із невдалим заплив — стала публічною.
Власна інфраструктура Private Cloud Compute виявилася надто повільною під час тестування. Apple потребувала зовнішньої обчислювальної потужності — і швидко.
Тристоронній «баку-оф», який виграв Google
За інформацією The Information, Apple провела відбір між трьома гравцями — Anthropic, Google і OpenAI. Перемогли моделі Gemini. Невдовзі Apple і Google опублікували спільну заяву: наступне покоління Apple Foundation Models буде базуватися на Gemini і хмарній інфраструктурі Google. Це не просто ліцензія на модель — Bloomberg повідомляє, що Apple планує платити близько $1 млрд на рік за використання AI від Google.
«Наступне покоління Apple Foundation Models буде засноване на моделях Google Gemini і хмарних технологіях»
Зі спільної заяви Apple і Google
Запити, які Siri не зможе обробити на пристрої, будуть передаватися до Google Cloud і виконуватися на чіпах Nvidia Blackwell B200 — тих самих, що стоять у найпотужніших серверах Gemini. Apple вже схвалила використання технології конфіденційних обчислень (confidential compute) від Nvidia: дані шифруються безпосередньо під час обробки на чіпі. За даними The Information, компанія перебуває в процесі придбання 250 серверів Nvidia NVL72 вартістю близько $4 млн кожен.
Гібридна архітектура як компроміс між приватністю та продуктивністю
Нова Siri працюватиме за трирівневою схемою:
- На пристрої — прості команди: будильники, налаштування, базові запити
- Private Cloud Compute на Apple Silicon — складніші завдання, де Apple контролює весь стек
- Google Cloud + Nvidia B200 — запити, що вимагають повної потужності Gemini
Craig Federighi ще у 2024 році пояснював, що частина запитів неминуче піде в хмару. Але тоді мовилося про власні сервери Apple. Тепер «хмара» — це інфраструктура Google з чіпами Nvidia, захищена технологією конфіденційних обчислень замість звичних гарантій Apple.
Реліз оновленої Siri очікується орієнтовно у вересні 2025 року разом з iOS 27. Персоналізовані функції — розуміння контексту застосунків і дії від імені користувача — перенесені на весну 2026-го.
Apple витрачає $1 млрд на рік, щоб не відставати від конкурентів у гонці, яку сама ж і програла на старті. Питання не в тому, чи вдасться їй наздогнати — а в тому, чи зможе компанія коли-небудь повернути повний контроль над стеком, якщо Gemini стане основою для мільярдів щоденних взаємодій з Siri.