Google répond correctement dans 9 cas sur 10. Mais avec 5 billions de requêtes par an, le reste représente des dizaines de millions d'erreurs par heure

L'analyse du startup Oumi pour le New York Times a montré que les aperçus alimentés par l'IA de Google sont exacts à 91 % — ce qui constitue à la fois un record de précision et une ampleur d'erreurs sans précédent dans la recherche.

08/04/2026 10:50

335

RazomUA - Google répond correctement dans 9 cas sur 10. Mais avec 5 billions de requêtes par an, le reste représente des dizaines de millions d'erreurs par heure — Ілюстративне фото: Depositphotos

Lorsque Google a lancé AI Overviews en 2024, l'entreprise l'a présenté comme une révolution dans la recherche. Maintenant, il existe des premières données indépendantes sur le prix de cette révolution pour l'utilisateur ordinaire.

Ce que l'étude a montré

La startup Oumi, sur commande du New York Times, a testé 4 326 requêtes de recherche Google, en utilisant le benchmark SimpleQA — un outil standard pour mesurer la précision factuelle des systèmes d'IA. En octobre 2024, lorsque AI Overviews fonctionnait sur la base de Gemini 2, la précision était de 85 %. Après la mise à jour vers Gemini 3 en février 2025, l'indicateur a augmenté à 91 %.

Le chiffre semble convaincant — jusqu'à ce qu'il ne soit rapporté à l'échelle. Google traite plus de 5 billions de requêtes de recherche par an. Même une marge d'erreur de 9 % signifie des dizaines de millions de réponses fausses par heure. Ce n'est pas un risque hypothétique — c'est l'état actuel du fonctionnement du produit utilisé par des centaines de millions de personnes.

Plus précis, mais moins vérifiable

Parallèlement à l'amélioration de la précision, l'étude a enregistré une tendance opposée dans la vérifiabilité des réponses. Avec Gemini 2, dans 37 % des réponses correctes, les sources ne confirmaient pas l'affirmation ou n'y étaient pas pertinentes. Avec Gemini 3, ce pourcentage a augmenté à 56 % — c'est-à-dire que plus de la moitié même des réponses correctes ne peuvent pas être vérifiées par les liens fournis par Google lui-même.

Les exemples de l'étude illustrent la mécanique des erreurs. À la question de savoir quand l'ancienne maison de Bob Marley est devenue un musée, AI Overviews a indiqué avec assurance l'année 1987 — bien que l'année correcte soit 1986, et que deux des trois sources citées ne contenaient pas cette date du tout. La troisième source, Wikipedia, présentait deux chiffres contradictoires, et le modèle a choisi le mauvais.

« AI responses may include mistakes »
— clause de non-responsabilité standard de Google sous chaque réponse IA, qui, comme l'a montré l'étude, restait largement inaperçue des utilisateurs

Réaction de Google : la méthodologie en question

Le représentant de Google Ned Adriance a appelé l'étude à avoir des « lacunes sérieuses », affirmant que SimpleQA lui-même contient des questions incorrectes et ne reflète pas les véritables modèles de recherche des utilisateurs. L'entreprise note que pour ses évaluations internes, elle utilise SimpleQA Verified — un ensemble plus petit mais sélectionné plus soigneusement.

Cependant, la position de Google ne réfute pas le fait lui-même du fossé entre les indicateurs de précision et de vérifiabilité. La clause de non-responsabilité « l'IA peut se tromper » existait auparavant — mais l'ampleur à laquelle cela « peut » se produire n'a pas été mesurée publiquement jusqu'à cette étude.

L'effet plus large : qui paie pour les erreurs

Parallèlement à la question de la précision se déploie un problème économique distinct. Une étude du Pew Research Center a montré : les utilisateurs qui voient AI Overview vont deux fois moins souvent sur des sites externes. Selon SimilarWeb, le trafic de recherche mondial (humain) a chuté d'environ 15 % au cours de l'année jusqu'en juin 2025, et certains éditeurs signalent une baisse du taux de clics jusqu'à 89 %.

Lorsque AI Overviews sont présents dans les résultats, le CTR pour le lien organique principal tombe à 8 % contre 15 % sans bloc IA
Les utilisateurs cliquent sur des liens au sein d'AI Overview dans seulement 1 % des cas
Les éditeurs s'attendent à une baisse du trafic de recherche en moyenne de 43 % en trois ans

Autrement dit, AI Overviews génèrent à la fois des erreurs et coupent le trafic vers les sources qui pourraient corriger ces erreurs.

Si Google ne divulgue pas ses propres données sur la part réelle des requêtes de recherche qui reçoivent AI Overview, et ne fournit pas une méthodologie d'évaluation de la précision indépendamment vérifiée — toute discussion sur un « niveau d'erreur acceptable » restera une conversation avec des variables inconnues. La question n'est pas de savoir si 91 % est suffisamment bon. La question est de savoir si Google est prêt à montrer combien exactement de millions de réponses fausses par heure il considère comme un prix acceptable pour la commodité.

Actualités mondiales

Des cautions pour les corrompus à la place de drones ? Une discussion franche sur la survie, la confiance et la défense aérienne des communautés

1

Plus qu'un simple jeu : former des patriotes et rendre hommage aux héros à Bilohorodka

2

La première yeshiva de l'Ukraine indépendante : des fondations posées sous les bombes à l'inauguration

3

Le monde entre dans une phase de chaos et de guerre d'usure

4

Serhiy Vasyliuk : « L'amour de sa terre natale est aussi une arme »

5

La bataille d'Ormuz, les dossiers du Pentagone sur les ovnis et le Su-57 près de Tcheliabinsk — le résumé de la semaine

Politique

La Grande-Bretagne prépare des sanctions contre le secteur financier russe — bureau de Zelensky

Le représentant du président a confirmé : Londres prépare de nouvelles restrictions après les critiques concernant l'assouplissement du plafond pétrolier. La mise en place d'un mécanisme de contrôle reste la question clé.

il y a 4 jours

Technologies

Ferrari Luce à 550 000 € : la première voiture électrique de la marque a été développée pendant cinq ans — et elle n'a pas d'écran tactile

Ferrari a officiellement présenté la Luce — une voiture électrique à quatre portes et cinq places d'une puissance de 1000 chevaux, au prix à partir de 550 000 €. Le design provient de Jony Ive, les boutons sont physiques, et les actions de Ferrari ont chuté de 3% le jour de la présentation.

il y a 4 jours

Technologies

Supprimer — et cela disparaîtra aussi de OneDrive. Mais seulement jusqu'en septembre 2026

Samsung et Microsoft suppriment la synchronisation intégrée de la Galerie avec OneDrive. Ce n'est pas une catastrophe, mais il y a une subtilité comportementale dont peu de gens sont conscients : après la transition vers une application distincte, la suppression de photos du smartphone n'effacera plus les fichiers du cloud.

il y a 4 jours

Déserteur ayant ouvert le feu sur les agents du service pénitentiaire venus le ramener

Le dépôt n'est plus un bouclier contre l'exécution : ce que la loi sur la numérisation des recouvrements a changé

Il a pris une voiture qui ne lui appartenait pas pour aller à Khmelnytski — et c'est là qu'on l'a trouvé

Google répond correctement dans 9 cas sur 10. Mais avec 5 billions de requêtes par an, le reste représente des dizaines de millions d'erreurs par heure

Ce que l'étude a montré

Plus précis, mais moins vérifiable

Réaction de Google : la méthodologie en question

L'effet plus large : qui paie pour les erreurs

Actualités mondiales

Le Parlement britannique rejette le modèle scandinave : ce que la loi de 2026 signifie pour l'industrie des escortes

La révolution numérique en Allemagne : comment les technologies et la loi ont sorti l'industrie de l'escorte de l'ombre

Divorce houleux : les États-Unis quittent l'OMS et laissent une dette de 260 millions de dollars — que signifie cela pour la santé et la sécurité de l'Ukraine ?

Plus qu'un simple jeu : former des patriotes et rendre hommage aux héros à Bilohorodka

La première yeshiva de l'Ukraine indépendante : des fondations posées sous les bombes à l'inauguration

Le monde entre dans une phase de chaos et de guerre d'usure

Serhiy Vasyliuk : « L'amour de sa terre natale est aussi une arme »

La bataille d'Ormuz, les dossiers du Pentagone sur les ovnis et le Su-57 près de Tcheliabinsk — le résumé de la semaine

La Grande-Bretagne prépare des sanctions contre le secteur financier russe — bureau de Zelensky

Ferrari Luce à 550 000 € : la première voiture électrique de la marque a été développée pendant cinq ans — et elle n'a pas d'écran tactile

Supprimer — et cela disparaîtra aussi de OneDrive. Mais seulement jusqu'en septembre 2026

L'UE contre Google : pourquoi la nouvelle amende pourrait changer plus que les précédentes

« Azov » frappe sur la route Marioupol-Taganrog non pas pour la Crimée — mais la Crimée aussi s'inquiète

26 mai : la Géorgie célèbre 107 ans d'indépendance — et les parallèles avec l'Ukraine n'ont plus besoin d'explication

Ne manquez pas l'essentiel