KI liest Tumor wie Text – und ist bereits präziser als die meisten Diagnosesysteme

# Harvard-Modell CHIEF übertrifft andere KI-Systeme um 36% bei Krebsdiagnose. Parallel erhielt ein Tool zur Vorhersage von Frühgeburten die FDA-Zulassung. Doch hinter den Genauigkeitszahlen verbirgt sich eine Frage, die die Medizin noch nicht gelöst hat.

44
Teilen:

Als Forscher der Harvard Medical School und des Beth Israel Deaconess Medical Center ihr neues Künstliche-Intelligenz-Modell mit echten Ärzten bei der Erstdiagnose verglichen, war das Ergebnis für die medizinische Gemeinschaft unbequem: In bestimmten Szenarien war die KI genauer. Das bedeutet nicht, dass der Algorithmus den Arzt ersetzen wird — aber es bedeutet, dass die Frage „wer stellt die Diagnose" nicht mehr so eindeutig ist.

Das Modell, das Tumoren liest

Das Harvard-Modell CHIEF (Clinical Histopathology Imaging Evaluation Foundation) wurde auf 15 Millionen digitalen Schnitten von Tumorgewebe trainiert. Nach Angaben der Zeitschrift Cancer (Wiley) übertrifft es andere führende KI-Methoden um bis zu 36% bei komplexen diagnostischen Aufgaben — von der Erkennung von Krebszellen bis zur Vorhersage der Patientenüberlebensrate und des Behandlungserfolgs.

„Unser Ehrgeiz ist es, eine flexible, universelle ChatGPT-ähnliche Plattform zu schaffen, die ein breites Spektrum von onkologischen Diagnoseaufgaben erfüllt"

Kun-Hsing Yu, außerordentlicher Professor für biomedizinische Informatik an der Harvard Medical School

Wichtig: CHIEF erkennt nicht einfach nur das Vorhandensein von Krebs. Er prognostiziert das molekulare Profil des Tumors basierend auf visuellen Merkmalen der Zellen — ohne zusätzliche genetische Tests. Für Patienten in Ländern ohne entwickelte molekulare Diagnostik könnte dies Zugang zu personalisierter Behandlung bedeuten, wo es bisher nicht vorhanden war.

Gleichzeitig zeigte eine andere Harvard-Studie einen besorgniserregenden Nebeneffekt: pathologische KI-Modelle sind in der Lage, demografische Merkmale von Patienten (Alter, Geschlecht, Rasse) direkt aus Gewebeproben abzulesen. Dies führt zu potenziellen Vorurteilen in der Diagnose — unterschiedlich für verschiedene Bevölkerungsgruppen.

Frühgeburten: von 39% Sensitivität zur FDA-Genehmigung

Ein paralleler Forschungsbereich ist die Geburtshilfe. Das Unternehmen Ultrasound AI veröffentlichte die Ergebnisse der PAIR-Studie (Perinatal Artificial Intelligence in Ultrasound) im Journal of Maternal-Fetal & Neonatal Medicine. Sein Modell analysiert Standard-Ultraschallaufnahmen und prognostiziert das genaue Geburtsdatum mit einem R²-Wert von 0,95 für termingerechte Geburten und R²=0,92 für alle Fälle.

Spezifisch für Frühgeburten: Nach mehreren Trainingsiterationen stieg die Sensitivität des Modells, während die Spezifität auf 93% gehalten wurde. Die FDA erteilte dem Instrument eine De-Novo-Genehmigung — das heißt, sie erkannte es als klinisch begründete neue Klasse eines medizinischen Geräts an.

Die Entwickler betonen besonders die Anwendung in „geburtshilflichen Wüsten" — Regionen ohne Zugang zu hochspezialisierten Diensten. Das Instrument erfordert keine neue Ausrüstung: Es funktioniert mit den Ultraschalldaten, die bereits in gewöhnlichen Kliniken gesammelt werden.

Was zwischen Algorithmus und Patient steht

Technische Genauigkeit ist nicht die einzige Hürde. Zu den ungelösten Problemen gehören:

  • Datenbias: Modelle, die auf homogenen Stichproben trainiert wurden, funktionieren bei unterrepräsentierten Gruppen schlechter — dies wurde bereits in Harvard-Pathologiestudien nachgewiesen.
  • Regulatorische Lücke: Die FDA genehmigt einzelne Instrumente, aber es gibt noch keinen einheitlichen Standard für die Überprüfung der KI-Diagnostik in der klinischen Praxis.
  • Verantwortung: Wenn die KI einen Fehler macht — wer trägt die juristische Verantwortung: der Entwickler, der Arzt, der dem System vertraut hat, oder das Krankenhaus?

Solange die Regulatoren keine klare Antwort auf die Verantwortungsfrage geben, wird die Masseneinführung der KI-Diagnostik in der klinischen Praxis eine Angelegenheit von Enthusiasten bleiben, nicht des Systems. Wenn im nächsten Jahr ein Gerichtsurteil zu einem Fehler eines KI-Instruments mit FDA-Genehmigung ergeht — das würde die Branche schneller verändern als jede neue Genauigkeitsstudie.

Weltnachrichten