Claude hat 80% des eigenen Codes geschrieben — und deshalb will Anthropic die KI-Entwicklung bremsen

Das Unternehmen veröffentlichte interne Daten, die nicht ein zukünftiges Risiko, sondern einen bereits vorhandenen Trend beschreiben: Das KI-Modell beschleunigt seine eigene Entwicklung schneller, als die Menschheit Zeit hatte zu vereinbaren, was man dagegen tun sollte.

42
Teilen:
Depositphotos_Claude

Ein Ingenieur von Anthropic hat in den letzten fünf Monaten keinen einzigen Code-Zeile geschrieben — nicht weil es keine Aufgaben gab, sondern weil Claude diese erledigt. Stand Mai 2026 stammen über 80% des Codes, der die Produktions-Codebasis des Unternehmens erreicht, von automatisierten Systemen, und Ingenieure liefern pro Quartal dreimal mehr Code ab als noch 2025. Dies ist keine Prognose — es ist bereits Realität, mit der Anthropic seine Argumentation für eine globale KI-Verlangsamung eröffnete.

Was ist «rekursive Selbstverbesserung» und warum macht sie selbst die Claude-Macher nervös

In einem Blog-Beitrag mit dem Titel «When AI Builds Itself», veröffentlicht am 4. Juni, argumentieren die Forscher Marina Favaro und Jack Clark: Die Welt müsse die Möglichkeit haben, die Entwicklung fortschrittlicher KI-Modelle zu verlangsamen oder vorübergehend zu pausieren, damit «gesellschaftliche Strukturen und Alignment-Forschung» mit dem Fortschritt Schritt halten. Alignment ist ein Branchenbegriff für die Abstimmung des KI-Verhaltens mit menschlichen Werten und Absichten.

Die von Anthropic beschriebene Kernbedrohung ist die rekursive Selbstverbesserung: KI-Systeme, die in der Lage sind, ihre eigenen Nachfolger eigenständig zu entwerfen und zu bauen, ohne menschliches Zutun. Clark und Favaro beschreiben eine nahe Zukunft, in der Modelle eigenständig Experimente durchführen, Hypothesen aufstellen und offene Forschung betreiben.

«Während der meisten KI-Geschichte haben Menschen jeden Schritt ihrer Entwicklung geleitet. Aber bei Anthropic delegieren wir zunehmend große Teile der KI-Entwicklung an die KI-Systeme selbst, was den Prozess beschleunigt».

Marina Favaro und Jack Clark, Anthropic Blog

Das Verbesserungstempo der Modelle verdoppelt sich ungefähr alle vier Monate — nicht alle sieben Monate, wie bisher angenommen. Claude Mythos Preview, ein beschränktes internes Modell des Unternehmens, zeigte eine 52-fache Beschleunigung beim Schreiben von Code für maschinelles Lernen.

Drei Szenarien — und nur eines erfordert keine Bremse

Favaro und Clark skizzierten drei mögliche Zukünfte: Die Fähigkeiten der KI könnten sich ausgleichen; der Effizienzgewinn könnte weitergehen, würde aber auf Engpässe in anderen Teilen der Softwareentwicklung stoßen; oder KI-Systeme könnten vollständige rekursive Selbstverbesserung erreichen und ihre eigenen Nachfolger eigenständig bauen. Gerade das dritte Szenario veranlasst die Autoren, zum Bremsen aufzufordern.

Welche konkreten Lösungsvorschläge macht Anthropic — und wo liegt das Problem

Anstelle eines einseitigen Moratoriums schlägt Anthropic ein System vor, bei dem mehrere führende Labore aus verschiedenen Ländern sich einigen könnten, gleichzeitig zu stoppen und zu überprüfen, dass die anderen tatsächlich das Gleiche tun. Die Analogie ist Rüstungskontrolle.

Doch Verifizierung ist genau das, was es bislang nicht gibt. KI-Systeme an der Grenze verlassen sich auf massive Recheninfrastruktur, was jede Überwachung oder Durchsetzung einer Verlangsamung erschwert. Anthropic plant in den kommenden Monaten Konsultationen mit Politikern, Wissenschaftlern und anderen Beteiligten, um Antworten auf Fragen rund um rekursive Selbstverbesserung und Verifikationsmechanismen zu finden.

Warum Kritiker mit Skepsis reagieren

Anthropic veröffentlichte diesen Appell in einem Moment, in dem das Unternehmen gerade zum teuersten KI-Unternehmen aufgestiegen ist und OpenAI überholt hat, während es sich gleichzeitig auf einen Börsengang vorbereitet. Kritiker weisen darauf hin: Das Unternehmen fordert gleichzeitig alle zur Verlangsamung auf und bereitet sich selbst auf die Börsennotierung vor. Der Wharton-Professor Ethan Mollick bewertete das Material als Mischung aus Selbstanalyse, Marketing und durchaus echten Überzeugungen.

  • 80% des Codes in Anthropics Produktions-Basis wurden von Claude geschrieben
  • ×8 — um diesen Faktor hat sich der Code-Output pro Quartal gegenüber 2024 erhöht
  • ×4 Monate — der aktuelle Verdoppelungszyklus für Modell-Fähigkeiten
  • ×52 — Beschleunigung bei Aufgaben des maschinellen Lernens im internen Mythos-Modell

Sollte Anthropic tatsächlich eine verifizierte Vereinbarung zwischen Laboren treffen, bevor seine eigenen Modelle die Schwelle zur rekursiven Selbstverbesserung erreichen, hätte der Appell Gewicht. Falls nicht — bleibt er das kostspieligste Statement of Intent der Welt, abgegeben von einem Unternehmen, das besser als alle anderen versteht, was es gerade aufbaut.

Weltnachrichten