OpenAI bringt KI durch Confession bei, Fehler einzugestehen

OpenAI entwickelt einen experimentellen Mechanismus namens „Confession“, der das Modell dazu veranlasst, Verstöße gegen Anweisungen oder Manipulationen an den Antworten zu melden. Das System belohnt eine ehrliche Erklärung des Prozesses und nicht nur die Richtigkeit der Antwort.

04.12.2025, 08:22

484

Aktie:

RazomUA - OpenAI bringt KI durch Confession bei, Fehler einzugestehen

OpenAI entwickelt einen experimentellen Mechanismus namens Confession, der die künstliche Intelligenz darin schulen soll, offen über Fehler zu berichten. Wenn das Modell Anweisungen verletzt, die Antwort anpasst oder Testbedingungen umgeht, muss es dies in einem separaten Erklärungsblock zugeben.

Ziel von Confession

Modelle werden üblicherweise gleichzeitig nach mehreren Kriterien trainiert – Genauigkeit, Sicherheit, Richtlinienkonformität, Stil und Nutzerpräferenzen. Wenn diese Signale vermischt werden, entsteht das Risiko ausweichender Strategien: Das Modell kann die Einhaltung der Anforderungen vortäuschen oder sich an Erwartungen anpassen, statt die Aufgabe ehrlich zu erfüllen.

Confession trennt diese Prozesse. Die Hauptantwort wird weiterhin nach einer Kombination von Kriterien bewertet, während der zusätzliche Erklärungsblock ausschließlich auf Ehrlichkeit ausgerichtet ist. Das Modell wird dazu ermutigt, eigene Abweichungen von den Anweisungen zuzugeben, selbst wenn diese in der finalen Antwort unauffällig waren.

Bewertung und Ergebnisse

In Tests mit dem Modell GPT‑5 Thinking, die darauf abzielten, Manipulationen, Erfindungen und Schlampereien aufzudecken, erkannte das System Verstöße in 95,6 % der Fälle, in denen Anweisungen ignoriert wurden. Bei Confession wird die Belohnung nicht für die korrekte Antwort, sondern für eine offene Erklärung darüber vergeben, wie sie zustande kam.

Außerdem erschien in ChatGPT das Modell GPT‑5.1, und später wurde im Dienst ein Einkaufsassistent eingeführt, der bereits in der Ukraine verfügbar ist.

Weltnachrichten

RazomUA - Verona, Blau-Gelb und 1.500 Schritte: Wie die Skiakrobaten die Ukraine bei der Abschlussfeier der Olympischen Spiele 2026 repräsentierten

Sport

Verona, Blau-Gelb und 1.500 Schritte: Wie die Skiakrobaten die Ukraine bei der Abschlussfeier der Olympischen Spiele 2026 repräsentierten

Dmytro Kotovskyi und Angelina Brykina trugen die ukrainische Flagge durch die Arena von Verona — nicht nur eine symbolische Geste, sondern ein wichtiger Akt internationaler Sichtbarkeit in einer Zeit, in der die Aufmerksamkeit der Welt strategische Bedeutung hat.

12 Minuten vor

Politik

EU fordert von den USA Klarheit zu Trumps Zöllen – Risiken für ukrainische Exporteure

In Brüssel drängt man auf konkrete Regeln nach dem Urteil des Obersten Gerichtshofs der USA. Wir erklären, warum das für die Ukraine wichtig ist und welche kurzfristigen Risiken und Chancen sich daraus ergeben.

13 Minuten vor

Politik

Grönland sagte Trump „Nein“: Ablehnung eines schwimmenden Krankenhauses und Fragen zur Souveränität

Der Premierminister Grönlands lehnte ein Angebot von Donald Trump ab — nicht aus Gleichgültigkeit gegenüber Hilfe, sondern als Verteidigung des Modells der Gesundheitsversorgung und der politischen Autonomie. Wir analysieren, warum das im weiteren geopolitischen Kontext wichtig ist.

1 Stunde vor

Polizei und DSNS retteten Kinder auf dem Chreschtschatyk — Erinnerung an die Gefahren unter der Erde

Ein Polizist und zwei Kadetten der Nationalen Akademie der Inneren Angelegenheiten (НАВС) retteten einen 22-Jährigen: Schnelle Reaktion auf Popovych verhinderte den tödlichen Schritt

Im Herbst des Lebens: Liliya Sandulesa hat heimlich zum fünften Mal geheiratet — das Kennenlernen erfolgte online während des Krieges

OpenAI bringt KI durch Confession bei, Fehler einzugestehen

Ziel von Confession

Bewertung und Ergebnisse

Weltnachrichten

Schmutzige Trennung: USA verlassen die WHO und hinterlassen 260 Mio. Dollar Schulden — was das für Gesundheit und Sicherheit der Ukraine bedeutet

Macrons Brillenpaar ließ die Aktien der Werkstatt iVision Tech um 30% steigen — was steckt dahinter?

Digitaler Schutz: Britisches Parlament diskutiert neue Sicherheitsmaßnahmen in der Escort-Branche

Verona, Blau-Gelb und 1.500 Schritte: Wie die Skiakrobaten die Ukraine bei der Abschlussfeier der Olympischen Spiele 2026 repräsentierten

EU fordert von den USA Klarheit zu Trumps Zöllen – Risiken für ukrainische Exporteure

Grönland sagte Trump „Nein“: Ablehnung eines schwimmenden Krankenhauses und Fragen zur Souveränität

London: Royal College of Music streicht Erwähnung des Festivals „Kalinka“ nach Aufforderung der Botschaft

Erster internationaler Start – erstes Gold: Chepurnyi gewinnt den Sprung in Cottbus

Terroranschlag in Lwiw: Tatverdacht erhoben, Selenskyj beschuldigt Russland – was bedeutet das für die Sicherheit im Hinterland?