Google antwortet in 9 von 10 Fällen korrekt. Aber bei 5 Billionen Anfragen pro Jahr bedeutet der Rest Dutzende Millionen Fehler pro Stunde

Eine Analyse des Startups Oumi für die New York Times hat gezeigt: Googles AI Overviews sind zu 91 Prozent genau — ein Rekord bei der Genauigkeit und gleichzeitig ein Fehlerumfang, den es in der Suchmaschine bisher nicht gab.

08.04.2026, 10:50

333

RazomUA - Google antwortet in 9 von 10 Fällen korrekt. Aber bei 5 Billionen Anfragen pro Jahr bedeutet der Rest Dutzende Millionen Fehler pro Stunde — Ілюстративне фото: Depositphotos

Als Google 2024 AI Overviews startete, positionierte das Unternehmen dies als Revolution in der Suche. Nun gibt es erste unabhängige Daten über den Preis dieser Revolution für den durchschnittlichen Nutzer.

Was die Studie zeigte

Das Startup Oumi testete im Auftrag der New York Times 4.326 Google-Suchanfragen mit Hilfe des branchenüblichen Benchmarks SimpleQA — einem Standardwerkzeug zur Messung der faktischen Genauigkeit von KI-Systemen. Im Oktober 2024, als AI Overviews auf Basis von Gemini 2 liefen, betrug die Genauigkeit 85 %. Nach dem Update auf Gemini 3 im Februar 2025 stieg dieser Wert auf 91 %.

Die Zahl wirkt überzeugend — bis sie auf die Größenordnung angewendet wird. Google verarbeitet über 5 Billionen Suchanfragen pro Jahr. Selbst eine 9-prozentige Fehlerquote bedeutet Dutzende Millionen falscher Antworten pro Stunde. Dies ist kein hypothetisches Risiko — es ist der aktuelle Zustand eines Produkts, das von Hunderten Millionen Menschen verwendet wird.

Präziser, aber weniger überprüfbar

Parallel zur Verbesserung der Genauigkeit verzeichnete die Studie einen gegenteiligen Trend bei der Überprüfbarkeit der Antworten. Mit Gemini 2 bestätigten in 37 % der korrekten Antworten die Quellen entweder nicht die Aussage oder waren für sie nicht relevant. Mit Gemini 3 stieg diese Quote auf 56 % — das heißt, mehr als die Hälfte selbst der korrekten Antworten können durch die von Google bereitgestellten Links nicht überprüft werden.

Beispiele aus der Studie veranschaulichen den Mechanismus der Fehler. Bei der Frage, wann das ehemalige Haus von Bob Marley zu einem Museum wurde, gab AI Overviews selbstsicher das Jahr 1987 an – obwohl das richtige Jahr 1986 war, und zwei der drei zitierten Quellen dieses Datum überhaupt nicht enthielten. Die dritte Quelle, Wikipedia, gab zwei widersprechende Zahlen an, und das Modell wählte die falsche.

«AI responses may include mistakes»
— der Standard-Disclaimer von Google unter jeder KI-Antwort, der laut Studie von den Nutzern größtenteils unbemerkt blieb

Googles Reaktion: Methodik in Frage gestellt

Ein Sprecher von Google, Ned Adriance, bezeichnete die Studie als eine mit «erheblichen Lücken» und argumentiert, dass SimpleQA selbst fehlerhafte Fragen enthält und nicht die realen Suchmuster der Nutzer widerspiegelt. Das Unternehmen weist darauf hin, dass es für interne Bewertungen SimpleQA Verified verwendet — einen kleineren, aber sorgfältiger ausgewählten Fragensatz.

Doch Googles Position widerlegt nicht die Tatsache der Diskrepanz zwischen Genauigkeits- und Überprüfbarkeitswerten selbst. Der Disclaimer «KI kann Fehler machen» existierte bereits vorher — aber das Ausmaß, in dem dies «kann» passiert, wurde bisher nicht öffentlich gemessen.

Breitere Auswirkungen: Wer zahlt für die Fehler

Parallel zur Frage der Genauigkeit entsteht ein separates wirtschaftliches Problem. Eine Studie des Pew Research Center zeigte: Nutzer, die einen AI Overview sehen, klicken doppelt so selten auf externe Websites. Nach Angaben von SimilarWeb ist der weltweite organische Suchverkehr (menschlich) im Jahr bis Juni 2025 um etwa 15 % zurückgegangen, und einige Verlage berichten von Rückgängen der Klickrate von bis zu 89 %.

Wenn AI Overviews in den Ergebnissen vorhanden sind, sinkt die Klickrate (CTR) für den oberen organischen Link auf 8 % gegenüber 15 % ohne KI-Block
Nutzer klicken auf Links innerhalb von AI Overview nur in 1 % der Fälle
Verlage erwarten einen durchschnittlichen Rückgang des Suchverkehrs um 43 % in drei Jahren

Mit anderen Worten: AI Overviews erzeugen Fehler und schneiden gleichzeitig den Datenverkehr zu den Quellen ab, die diese Fehler hätten korrigieren können.

Solange Google seine eigenen Daten über den tatsächlichen Anteil der Suchanfragen, die AI Overview erhalten, nicht offenleggt und keine unabhängig verifizierte Methodik zur Genauigkeitsbewertung bereitstellt, wird jede Diskussion über ein «akzeptables Fehlerniveau» ein Gespräch mit unbekannten Variablen bleiben. Die Frage ist nicht, ob 91 % gut genug sind. Die Frage ist, ob Google bereit ist zu zeigen, wie viele Millionen falscher Antworten pro Stunde es als akzeptablen Preis für Komfort erachtet.

Weltnachrichten

Kautionen für Korrupte statt Drohnen? Ein offenes Gespräch über Überleben, Vertrauen und die Luftabwehr der Gemeinden

1

Mehr als nur ein Spiel: Die Erziehung von Patrioten und die Ehrung von Helden in Bilohorodka

2

Die erste Jeschiwa der unabhängigen Ukraine: vom Fundament unter Raketen bis zur Eröffnung

3

Die Welt rutscht in eine Phase des Chaos und eines Zermürbungskrieges

4

Serhij Wasyljuk: „Die Liebe zum eigenen Land ist auch eine Waffe“

5

Die Schlacht in Ormuz, die UFO-Akten des Pentagons und die Su-57 bei Tscheljabinsk – ein Wochenrückblick

Politik

Großbritannien bereitet Sanktionen gegen Russlands Finanzsektor vor — Zelenski-Büro

Bevollmächtigter des Präsidenten bestätigt: London bereitet neue Beschränkungen nach Kritik an Lockerung der Ölpreisobergrenze vor. Die Frage eines Kontrollmechanismus bleibt zentral.

4 Tage vor

Technologien

Ferrari Luce für 550.000 Euro: Der erste Elektrowagen der Marke wurde fünf Jahre lang entwickelt – und kommt ohne Touchscreen

Ferrari hat offiziell den Luce vorgestellt – einen viertürigen fünfsitzigen Elektroautomobil mit 1000 PS zum Preis ab €550.000. Das Design stammt von Jony Ive, die Bedienelemente sind physische Tasten, und die Ferrari-Aktien fielen am Tag der Präsentation um 3%.

4 Tage vor

Technologien

Löschen — und es verschwindet auch in OneDrive. Aber nur bis September 2026

Samsung und Microsoft entfernen die integrierte Gallery-Synchronisierung mit OneDrive. Das ist keine Katastrophe, aber es gibt eine Besonderheit beim Verhalten, die nur wenige kennen: Nach dem Wechsel zu einer separaten Anwendung werden Fotos, die vom Smartphone gelöscht werden, nicht mehr aus der Cloud gelöscht.

4 Tage vor

Armeeflüchtling eröffnet das Feuer auf MilitärPolizisten, die ihn zurückholen wollten

Kaution als Schutz vor Gerichtsvollziehern funktioniert nicht mehr: Was das Gesetz zur Digitalisierung der Zwangsvollstreckung geändert hat

Mit fremdem Auto nach Chmelnytzkyj gefahren — und dort wurde er gefunden

Google antwortet in 9 von 10 Fällen korrekt. Aber bei 5 Billionen Anfragen pro Jahr bedeutet der Rest Dutzende Millionen Fehler pro Stunde

Was die Studie zeigte

Präziser, aber weniger überprüfbar

Googles Reaktion: Methodik in Frage gestellt

Breitere Auswirkungen: Wer zahlt für die Fehler

Weltnachrichten

Das britische Parlament lehnt das skandinavische Modell ab: Was das Gesetz von 2026 für die Escortbranche bedeutet

Digitale Revolution in Deutschland: Wie Technologien und Gesetze die Escort‑Branche aus dem Schatten holten

Schmutzige Trennung: USA verlassen die WHO und hinterlassen 260 Mio. Dollar Schulden — was das für Gesundheit und Sicherheit der Ukraine bedeutet

Mehr als nur ein Spiel: Die Erziehung von Patrioten und die Ehrung von Helden in Bilohorodka

Die erste Jeschiwa der unabhängigen Ukraine: vom Fundament unter Raketen bis zur Eröffnung

Die Welt rutscht in eine Phase des Chaos und eines Zermürbungskrieges

Serhij Wasyljuk: „Die Liebe zum eigenen Land ist auch eine Waffe“

Die Schlacht in Ormuz, die UFO-Akten des Pentagons und die Su-57 bei Tscheljabinsk – ein Wochenrückblick

Großbritannien bereitet Sanktionen gegen Russlands Finanzsektor vor — Zelenski-Büro

Ferrari Luce für 550.000 Euro: Der erste Elektrowagen der Marke wurde fünf Jahre lang entwickelt – und kommt ohne Touchscreen

Löschen — und es verschwindet auch in OneDrive. Aber nur bis September 2026

EU gegen Google: Warum die nächste Geldbuße mehr verändern könnte als die vorherigen

„Asow" schlägt auf der Route Mariupol–Taganrog nicht wegen der Krim – aber die Krim ist auch nervös

26. Mai: Georgien feiert 107 Jahre Unabhängigkeit — und die Parallelen zur Ukraine müssen nicht mehr erklärt werden

Verpassen Sie nichts Wichtiges