В 2024 году Apple представила iPhone 16 как устройство, созданное для нового поколения Siri. Год спустя голосовой помощник так и не получил заявленных функций. В марте 2025-го компания публично признала задержку — через пять месяцев после начала продаж.
Что пошло не так внутри
По данным источников 9to5Mac и The Information, инженеры Apple столкнулись с фундаментальной проблемой архитектуры: интеграция новой AI-системы со старой платформой Siri утроила частоту ошибок. Это заставило компанию фактически переписывать помощника с нуля. Джон Джаннандреа, старший вице-президент по AI, потерял контроль над потребительскими продуктами — его роль сузилась до исследований. Robby Walker, старший директор команды Siri, покинул Apple после того, как его речь на внутреннем совещании — где он сравнил незавершенный проект с неудачным плаванием — стала публичной.
Собственная инфраструктура Private Cloud Compute оказалась слишком медленной при тестировании. Apple потребовалась внешняя вычислительная мощность — и быстро.
Трёхсторонний «разбор», который выиграл Google
По информации The Information, Apple проводила отбор между тремя игроками — Anthropic, Google и OpenAI. Победили модели Gemini. Вскоре Apple и Google опубликовали совместное заявление: следующее поколение Apple Foundation Models будет основано на Gemini и облачной инфраструктуре Google. Это не просто лицензия на модель — Bloomberg сообщает, что Apple планирует платить около $1 млрд в год за использование AI от Google.
«Следующее поколение Apple Foundation Models будет основано на моделях Google Gemini и облачных технологиях»
Из совместного заявления Apple и Google
Запросы, которые Siri не сможет обработать на устройстве, будут передаваться в Google Cloud и выполняться на чипах Nvidia Blackwell B200 — тех же, что стоят в самых мощных серверах Gemini. Apple уже одобрила использование технологии конфиденциальных вычислений (confidential compute) от Nvidia: данные шифруются непосредственно во время обработки на чипе. По данным The Information, компания находится в процессе приобретения 250 серверов Nvidia NVL72 стоимостью около $4 млн каждый.
Гибридная архитектура как компромисс между приватностью и производительностью
Новая Siri будет работать по трёхуровневой схеме:
- На устройстве — простые команды: будильники, настройки, базовые запросы
- Private Cloud Compute на Apple Silicon — более сложные задачи, где Apple контролирует весь стек
- Google Cloud + Nvidia B200 — запросы, требующие полной мощности Gemini
Craig Federighi ещё в 2024 году объяснял, что часть запросов неизбежно пойдёт в облако. Но тогда речь шла о собственных серверах Apple. Теперь «облако» — это инфраструктура Google с чипами Nvidia, защищённая технологией конфиденциальных вычислений вместо обычных гарантий Apple.
Релиз обновленной Siri ожидается примерно в сентябре 2025 года вместе с iOS 27. Персонализированные функции — понимание контекста приложений и действия от имени пользователя — перенесены на весну 2026 года.
Apple тратит $1 млрд в год, чтобы не отстать от конкурентов в гонке, которую сама же и проиграла на старте. Вопрос не в том, удастся ли ей догнать — а в том, сможет ли компания когда-либо вернуть полный контроль над стеком, если Gemini станет основой для миллиардов ежедневных взаимодействий с Siri.