Ein Mathematiker gibt einen Hinweis – erhält eine fertige Anwendung aus der algebraischen Geometrie in 11 Minuten. Genau dieses Beispiel führte OpenAI-Präsident Greg Brockman auf einem Journalisten-Briefing an, um GPT-5.5 vorzustellen. Aber hinter dieser beeindruckenden Demonstration steckt ein wichtigeres Signal: Das Modell ist erstmals wirklich dafür ausgelegt, ohne einen Menschen daneben zu arbeiten.
Was ist neu
GPT-5.5 antwortet nicht nur besser auf Anfragen – sie plant eigenständig Maßnahmen, wechselt zwischen Tools und setzt ihre Arbeit fort, auch wenn sich der Plan ändert oder ein Versuch fehlschlägt. Nach Angaben von OpenAI erreicht das Modell eine höhere Ergebnisqualität mit weniger Token und weniger Versuchen im Vergleich zu GPT-5.4 – es wird gleichzeitig günstiger in der Anwendung und leistungsstärker.
Bei Benchmarks für Agent-Coding: Terminal-Bench 2.0 – 82,7%, SWE-Bench Pro – 58,6%. Im internen Test Expert-SWE, bei dem Aufgaben eine mediane Bearbeitungszeit von 20 Stunden durch Menschen haben, übertraf GPT-5.5 auch seinen Vorgänger.
«Das ist ein schnellerer, präziserer Denker mit weniger Token im Vergleich zu 5.4. Das bedeutet mehr Frontier-AI für Unternehmen und Verbraucher».
Greg Brockman, Präsident von OpenAI, beim Pressebriefi ng
Überraschende Tatsache: Das Modell ist leistungsstärker – aber nicht in der API
GPT-5.5 ist bereits für Benutzer von ChatGPT auf bezahlten Plänen (Plus, Pro, Business, Enterprise) und in Codex verfügbar. Aber Entwickler, die OpenAI-Modelle über die API integrieren, warten noch. OpenAI erklärt: Agent-Fähigkeiten erfordern separate Sicherheitsmaßnahmen für die großflächige Bereitstellung, und das Unternehmen «arbeitet aktiv mit Partnern» an deren Formalisierung. Der API-Zugang wird «sehr bald» versprochen – ohne konkretes Datum.
Das ist keine technische Einschränkung. GPT-5.5 wird bereits auf NVIDIA GB200 NVL72-Infrastruktur bedient, die nach NVIDIA-Angaben eine 50-mal höhere Leistung pro Watt im Vergleich zur vorherigen Generation bietet. Über 10.000 NVIDIA-Mitarbeiter verwenden das Modell bereits seit mehreren Wochen über Codex in der Unternehmensumgebung mit Nur-Lese-Zugriff auf Produktionssysteme.
Kontext: Release-Tempo
GPT-5.5 kam sechs Wochen nach GPT-5.4 heraus – das ist einer der kürzesten Update-Zyklen in der Geschichte des Unternehmens. Fortune beschreibt dies als Zeichen verstärkten Wettbewerbs um Unternehmenskunden. Nach OpenAI-Angaben hat ChatGPT über 900 Millionen aktive Nutzer pro Woche, 50 Millionen Abonnenten und 4 Millionen aktive Codex-Nutzer. Trotzdem wächst in den Medien die Erzählung, dass OpenAI das Tempo im Wettkampf mit Anthropic verliert – besonders im Unternehmenssektor.
In OpenAIs eigenen Vergleichstabellen übertrifft GPT-5.5 Claude Opus 4.5 bei Terminal-Bench 2.0, aber Anthropic bleibt bei SWE-Bench Pro vorne – und das nach OpenAIs eigenen Angaben.
Wohin das führt
OpenAI-Chefforscherin Mark Chen merkte an, dass das Modell «erkennbare Fortschritte bei wissenschaftlichen und technischen Forschungsprozessen» zeigt und bei der Arzneimittelentdeckung helfen kann. Brockman nannte GPT-5.5 einen Schritt zu einer «Super-Anwendung» – einer einzigen KI-Schnittstelle für jede Computerarbeit.
Die eigentliche Frage ist nicht, ob GPT-5.5 nützlich sein wird. Sie ist es bereits – für diejenigen, die sie nutzen. Die Frage liegt in den Bedingungen: Wenn OpenAI die API ohne klar definierte Mechanismen zur Kontrolle von Agent-Sitzungen öffnet, was genau würde das Modell davon abhalt en, Aktionen auszuführen, die der Nutzer nicht vorhersah?