Un mathématicien donne un indice — reçoit une application prête à l'emploi de géométrie algébrique en 11 minutes. C'est exactement cet exemple que le président d'OpenAI, Greg Brockman, a présenté lors d'une conférence de presse aux journalistes, lors de la présentation de GPT-5.5. Mais derrière cette démonstration spectaculaire se cache un signal plus important : le modèle est pour la première fois vraiment conçu pour fonctionner sans supervision humaine.
Quoi de neuf
GPT-5.5 ne fait pas que mieux répondre aux requêtes — elle planifie les actions de manière autonome, bascule entre les outils et poursuit son travail même lorsque le plan change ou qu'une tentative échoue. Selon OpenAI, le modèle atteint une qualité de résultat supérieure avec moins de jetons et moins de tentatives par rapport à GPT-5.4 — c'est-à-dire qu'il devient moins cher à utiliser tout en devenant plus puissant.
Dans les benchmarks pour le codage d'agents : Terminal-Bench 2.0 — 82,7 %, SWE-Bench Pro — 58,6 %. Sur le test interne Expert-SWE, où les tâches ont un temps médian d'exécution humaine de 20 heures, GPT-5.5 a également surpassé son prédécesseur.
« C'est un penseur plus rapide et plus précis pour moins de jetons par rapport à 5.4. Cela signifie plus d'IA de pointe pour les entreprises et les consommateurs ».
Greg Brockman, président d'OpenAI, lors de la conférence de presse
Fait surprenant : le modèle est plus puissant — mais il n'est pas dans l'API
GPT-5.5 est déjà disponible pour les utilisateurs de ChatGPT sur les plans payants (Plus, Pro, Business, Enterprise) et dans Codex. Mais les développeurs qui intègrent les modèles d'OpenAI via l'API attendent toujours. OpenAI explique que les capacités d'agents requièrent des mesures de sécurité distinctes pour un déploiement à grande échelle, et l'entreprise « travaille activement avec les partenaires » sur leur formalisation. L'accès via l'API est promis « très bientôt » — sans date précise.
Ce n'est pas une limitation technique. GPT-5.5 est déjà desservie sur l'infrastructure NVIDIA GB200 NVL72, qui, selon NVIDIA, offre une efficacité énergétique 50 fois supérieure à la génération précédente. Plus de 10 000 employés de NVIDIA utilisent déjà le modèle depuis plusieurs semaines via Codex dans un environnement d'entreprise avec accès en lecture seule aux systèmes de production.
Contexte : le rythme des versions
GPT-5.5 est sortie six semaines après GPT-5.4 — c'est l'un des cycles de mise à jour les plus courts de l'histoire de l'entreprise. Fortune décrit cela comme un signe d'intensification de la concurrence pour les clients d'entreprise. Selon OpenAI, ChatGPT compte plus de 900 millions d'utilisateurs actifs par semaine, 50 millions d'abonnés et 4 millions d'utilisateurs actifs de Codex. Malgré cela, dans les médias, le récit grandit selon lequel OpenAI perd du terrain face à Anthropic — en particulier dans le segment des entreprises.
Sur ses propres tableaux de comparaison, OpenAI place GPT-5.5 au-dessus de Claude Opus 4.5 sur Terminal-Bench 2.0, mais Anthropic reste en tête sur SWE-Bench Pro — et ce selon les données d'OpenAI elle-même.
Vers où cela mène
Le directeur de la recherche d'OpenAI, Mark Chen, a noté que le modèle « montre des progrès sensibles dans les processus de recherche scientifique et technique » et peut aider à la découverte de médicaments. Brockman a appelé GPT-5.5 une étape vers une « super-application » — une interface IA unique pour n'importe quel travail informatique.
La vraie question n'est pas de savoir si GPT-5.5 sera utile. Elle l'est déjà — pour ceux qui l'utilisent. La question réside dans les conditions : si OpenAI ouvre l'API sans mécanismes de contrôle clairement définis pour les sessions d'agents, qu'est-ce qui empêchera exactement le modèle d'effectuer des actions que l'utilisateur n'avait pas prévues ?