OpenAI apprend à l'IA à admettre ses erreurs grâce à «Confession»

OpenAI développe un mécanisme expérimental, Confession, qui contraint le modèle à signaler les violations des consignes ou les manipulations des réponses. Le système récompense une explication honnête du processus, et pas seulement l'exactitude de la réponse.

04/12/2025 08:22

484

RazomUA - OpenAI apprend à l'IA à admettre ses erreurs grâce à «Confession»

OpenAI crée un mécanisme expérimental appelé Confession, destiné à apprendre à l'intelligence artificielle à communiquer ouvertement ses erreurs. Si le modèle viole les instructions, ajuste sa réponse ou contourne les conditions de test, il doit l'admettre dans un bloc explicatif séparé.

Objectif de Confession

Les modèles sont généralement entraînés simultanément selon plusieurs critères — exactitude, sécurité, conformité aux politiques, style et préférences de l'utilisateur. Lorsque ces signaux se mêlent, il existe un risque de stratégies d'évasion : le modèle peut simuler sa conformité aux exigences ou s'adapter aux attentes, au lieu d'exécuter honnêtement la tâche.

Confession sépare ces processus. La réponse principale est toujours évaluée selon l'ensemble des critères, tandis que le bloc explicatif additionnel se concentre uniquement sur l'honnêteté. Le modèle est encouragé à reconnaître ses propres écarts par rapport aux instructions, même si cela n'était pas apparent dans la réponse finale.

Évaluation et résultats

Lors d'essais avec le modèle GPT‑5 Thinking, visant à détecter les manipulations, les fabrications et le travail bâclé, le système reconnaissait des violations dans 95,6 % des cas où les instructions avaient été ignorées. Dans Confession, la récompense est accordée non pas pour une réponse correcte, mais pour une explication franche de la manière dont elle a été obtenue.

Par ailleurs, ChatGPT s'est vu doté du modèle GPT‑5.1, et plus tard le service a intégré un assistant pour les achats, déjà disponible en Ukraine.

Actualités du monde

Sport

Vérone, bleu-jaune et 1 500 pas : comment les skieurs acrobatiques ont représenté l'Ukraine à la clôture des Jeux olympiques 2026

Dmytro Kotovskyi et Angelina Brykina ont porté le drapeau de l'Ukraine dans l'arène de Vérone — non pas un simple geste symbolique, mais un acte important de visibilité internationale à un moment où l'attention du monde revêt une importance stratégique.

il y a 12 minutes

Politique

L'UE demande des éclaircissements aux États-Unis sur les tarifs de Trump — risques pour les exportateurs ukrainiens

À Bruxelles, on insiste sur des règles concrètes après la décision de la Cour suprême des États-Unis. Nous examinons pourquoi cela est important pour l'Ukraine et quels risques et opportunités à court terme cela engendre.

il y a 14 minutes

Politique

Le Groenland a répondu « non » à Trump : refus d'un navire-hôpital et question de souveraineté

Le Premier ministre du Groenland a rejeté la proposition de Donald Trump — non par indifférence à l'aide, mais pour défendre le modèle de son système de santé et son autonomie politique. Nous analysons pourquoi cela importe dans un contexte géopolitique plus large.

il y a 1 heure

La police et le Service d'État ukrainien des situations d'urgence (DSNS) ont sauvé des enfants sur Khreshchatyk — un rappel des dangers souterrains

Un policier et deux cadets de l'Académie nationale des affaires intérieures (НАВС) ont sauvé un homme de 22 ans : une réaction rapide à l'égard de Popovych a empêché un geste fatal

Au crépuscule de sa vie : Liliya Sandulesa s'est secrètement mariée pour la cinquième fois — leur rencontre a eu lieu en ligne pendant la guerre

OpenAI apprend à l'IA à admettre ses erreurs grâce à «Confession»

Objectif de Confession

Évaluation et résultats

Actualités du monde

Divorce houleux : les États-Unis quittent l'OMS et laissent une dette de 260 millions de dollars — que signifie cela pour la santé et la sécurité de l'Ukraine ?

Une paire de lunettes de Macron a fait bondir de 30 % l'action de l'atelier iVision Tech — qu'est-ce qui se cache derrière ?

Sécurité numérique : le Parlement britannique débat sur de nouvelles mesures dans le secteur des services d'escorte

Vérone, bleu-jaune et 1 500 pas : comment les skieurs acrobatiques ont représenté l'Ukraine à la clôture des Jeux olympiques 2026

L'UE demande des éclaircissements aux États-Unis sur les tarifs de Trump — risques pour les exportateurs ukrainiens

Le Groenland a répondu « non » à Trump : refus d'un navire-hôpital et question de souveraineté

Londres : le Royal College of Music a retiré la mention du festival « Kalinka » après une demande de l'ambassade

Premier départ international — première médaille d'or : Tchepurny remporte le saut de cheval à Cottbus

Attentat à Lviv : un suspect inculpé, Zelensky accuse la Russie — qu'est‑ce que cela change pour la sécurité des arrières ?