Когда исследователи Медицинской школы Гарварда и медицинского центра Beth Israel Deaconess сравнивали свою новую модель искусственного интеллекта с реальными врачами при первичной диагностике, результат оказался неудобным для медицинского сообщества: в определённых сценариях ИИ был точнее. Это не означает, что алгоритм заменит врача — но означает, что вопрос «кто ставит диагноз» уже не столь однозначен.
Модель, которая читает опухоль
Гарвардская модель CHIEF (Clinical Histopathology Imaging Evaluation Foundation) обучена на 15 миллионах цифровых срезов опухолевых тканей. По данным журнала Cancer (Wiley), она превосходит другие ведущие ИИ-методы на до 36% в комплексе диагностических задач — от выявления раковых клеток до прогноза выживаемости пациента и ответа на лечение.
«Наша амбиция — создать гибкую, универсальную ChatGPT-подобную платформу, которая выполняет широкий спектр задач онкологической диагностики»
Кун-Синь Юй, доцент кафедры биомедицинской информатики Медицинской школы Гарварда
Важно: CHIEF не просто детектирует наличие рака. Он прогнозирует молекулярный профиль опухоли на основе визуальных признаков клеток — без дополнительных генетических тестов. Для пациентов в странах без развитой молекулярной диагностики это может означать доступ к персонализированному лечению там, где его до сих пор не было.
В то же время другое исследование Гарварда выявило тревожный побочный эффект: патологические ИИ-модели способны считывать демографические признаки пациента (возраст, пол, расу) непосредственно из тканевых срезов. Это вносит потенциальное предубеждение в диагностику — различное для разных групп населения.
Преждевременные роды: от 39% чувствительности к FDA-разрешению
Параллельное направление — акушерство. Компания Ultrasound AI опубликовала результаты исследования PAIR (Perinatal Artificial Intelligence in Ultrasound) в The Journal of Maternal-Fetal & Neonatal Medicine. Её модель анализирует стандартные ультразвуковые снимки и прогнозирует точную дату родов с показателем R²=0,95 для своевременных родов и R²=0,92 для всех случаев.
Для преждевременных родов специфически: после нескольких итераций обучения чувствительность модели возросла, а специфичность держится на уровне 93%. FDA выдал инструменту разрешение De Novo — то есть признал его клинически обоснованным новым классом медицинского устройства.
Разработчики особенно подчеркивают применение в «акушерских пустынях» — регионах без доступа к узкоспециализированной помощи. Инструмент не требует нового оборудования: он работает с теми ультразвуковыми данными, которые уже собирают в обычных клиниках.
Что стоит между алгоритмом и пациентом
Техническая точность — не единственный барьер. Среди нерешённых проблем:
- Предубеждение данных: модели, обученные на однородных выборках, хуже работают на недопредставленных группах — это уже зафиксировано в гарвардских исследованиях патологии.
- Нормативный разрыв: FDA одобряет отдельные инструменты, но единого стандарта аудита ИИ-диагностики в клинической практике до сих пор нет.
- Ответственность: если ИИ ошибся — кто несёт юридическую ответственность: разработчик, врач, который доверился системе, или больница?
Пока регуляторы не дадут чёткий ответ на вопрос ответственности, массовое внедрение ИИ-диагностики в клиническую практику будет оставаться делом энтузиастов, а не системы. Если в следующем году появится судебный прецедент о ошибке ИИ-инструмента с одобрением FDA — это изменит индустрию быстрее, чем любое новое исследование точности.