Die KI-Branche erlebt einen weiteren Meilenstein: Anthropic, das von Amazon unterstützte Unternehmen und OpenAI-Konkurrent, hat am Donnerstag seine bisher leistungsstärkste Gruppe von Künstliche-Intelligenz-Modellen vorgestellt. Claude 4, bestehend aus den Modellen Claude Opus 4 und Claude Sonnet 4, setzt neue Maßstäbe für Programmierung, fortgeschrittenes Denken und KI-Agenten.
Anthropic Claude Opus 4: Was das weltbeste Programmiermodell kann
Alle warteten auf Claude Opus 3.5 und jetzt ist Opus 4 da. Das leistungsfähigste Modell von Anthropic wird vom Unternehmen als „weltweit bestes Programmiermodell“ positioniert. Die beeindruckenden Leistungsdaten sprechen für sich: Das Modell erreicht 72,5 Prozent auf SWE-bench und 43,2 Prozent auf Terminal-bench – Benchmarks, die die Fähigkeiten bei realen Software-Engineering-Aufgaben messen.
Was Claude Opus 4 besonders auszeichnet, ist seine Fähigkeit zur anhaltenden Leistung bei langwierigen Aufgaben. Das Modell kann kontinuierlich mehrere Stunden arbeiten und dabei komplexe, mehrstufige Prozesse bewältigen, die Tausende von Schritten erfordern. Diese Ausdauer übertrifft alle Sonnet-Modelle deutlich und erweitert die Möglichkeiten von KI-Agenten erheblich.
Branchenführer bestätigen die außergewöhnlichen Fähigkeiten des neuen Modells. Cursor bezeichnet es als „State-of-the-Art“ für die Programmierung und als Quantensprung im Verständnis komplexer Codebasen. Replit berichtet von verbesserter Präzision und dramatischen Fortschritten bei komplexen Änderungen über mehrere Dateien hinweg. Block hebt hervor, dass es das erste Modell ist, das die Code-Qualität während der Bearbeitung und Fehlerbehebung in seinem Agenten „goose“ steigert, dabei aber volle Leistung und Zuverlässigkeit beibehält.
Sonnet 4: Kraftpaket für die täglichen KI-Aufgaben
Claude Sonnet 4 stellt eine bedeutende Verbesserung gegenüber Sonnet 3.7 dar und erreicht beeindruckende 72,7 Prozent auf SWE-bench. Das Modell balanciert Leistung und Effizienz für interne und externe Anwendungsfälle und bietet verbesserte Steuerbarkeit für größere Kontrolle über Implementierungen.
GitHub plant, Claude Sonnet 4 als das Modell einzusetzen, das den neuen Programmieragenten in GitHub Copilot antreibt. Das Unternehmen lobt das Modell für seine herausragenden Leistungen in agentischen Szenarien. Manus hebt die Verbesserungen bei der Befolgung komplexer Anweisungen, klarem Denken und ästhetischen Ergebnissen hervor.
iGent berichtet, dass Sonnet 4 bei der autonomen Multi-Feature-App-Entwicklung excelliert und wesentlich verbesserte Problemlösungs- und Codebase-Navigationsfähigkeiten aufweist – Navigationsfehler wurden von 20 Prozent auf nahezu null reduziert. Sourcegraph sieht in dem Modell einen substanziellen Sprung in der Softwareentwicklung, da es länger auf Kurs bleibt, Probleme tiefer versteht und elegantere Code-Qualität liefert.
Gedächtnisfunktionen & Tool-Integration: Die Superkräfte von Claude 4
Beide Claude 4-Modelle sind hybride Modelle, die zwei Modi anbieten: nahezu sofortige Antworten und erweiterte Denkprozesse für tiefere Überlegungen. Eine besonders innovative Funktion ist „Extended thinking with tool use„, wobei beide Modelle Tools wie Websuche während erweiteter Denkprozesse nutzen können, um zwischen Überlegungen und Tool-Nutzung zu wechseln und so bessere Antworten zu liefern.
Die neuen Modellkapazitäten umfassen die parallele Tool-Nutzung, präzisere Befolgung von Anweisungen und – wenn Entwickler Zugang zu lokalen Dateien gewähren – deutlich verbesserte Gedächtnisfähigkeiten. Claude Opus 4 kann wichtige Fakten extrahieren und speichern, um Kontinuität zu gewährleisten und implizites Wissen über die Zeit aufzubauen.
Ein faszinierender Anwendungsfall demonstriert diese Gedächtnisfähigkeiten: Beim Spielen von Pokémon erstellt Opus 4 einen „Navigationsführer“ und führt echte Notizen, um sein Gameplay zu verbessern. Diese Fähigkeit zur Erstellung und Pflege von „Gedächtnisdateien“ ermöglicht besseres langfristiges Aufgabenbewusstsein und Kohärenz bei Agenten-Aufgaben.
Für Entwickler: Claude Code kommt zu VS Code und JetBrains
Nach umfangreichen positiven Rückmeldungen während der Forschungsvorschau wird Claude Code nun allgemein verfügbar. Die Plattform bringt die Macht von Claude in mehr Bereiche des Entwicklungsworkflows – im Terminal, in bevorzugten IDEs und im Hintergrund mit dem Claude Code SDK.
Neue Beta-Erweiterungen für VS Code und JetBrains integrieren Claude Code direkt in die IDE. Claudes vorgeschlagene Bearbeitungen erscheinen inline in den Dateien und optimieren die Überprüfung und Verfolgung innerhalb der vertrauten Editor-Oberfläche.
Das erweiterbare Claude Code SDK ermöglicht es Entwicklern, eigene Agenten und Anwendungen mit demselben Kern-Agenten wie Claude Code zu erstellen. Ein Beispiel für die Möglichkeiten ist Claude Code auf GitHub, das sich nun in der Beta-Phase befindet und auf Pull Requests reagieren, CI-Fehler beheben oder Code modifizieren kann.
Neue API-Funktionen & Preise
Anthropic veröffentlicht vier neue Funktionen über die Anthropic API, die Entwicklern ermöglichen, leistungsfähigere KI-Agenten zu erstellen: das Code-Ausführungstool, MCP-Connector, Files API und die Fähigkeit, Prompts bis zu einer Stunde zu cachen.
Der Geschäftserfolg von Anthropic spiegelt die wachsende Nachfrage nach fortgeschrittenen KI-Lösungen wider. Das Unternehmen bestätigte, dass der annualisierte Umsatz im ersten Quartal 2 Milliarden Dollar erreichte – mehr als eine Verdopplung gegenüber der 1-Milliarden-Dollar-Rate im vorherigen Zeitraum. Die Anzahl der Kunden, die jährlich mehr als 100.000 Dollar mit Anthropic ausgeben, stieg um das Achtfache gegenüber dem Vorjahr.
Jared Kaplan, Chief Science Officer von Anthropic, erklärt die strategische Ausrichtung des Unternehmens: „Wir haben Ende letzten Jahres aufgehört, in Chatbots zu investieren, und uns stattdessen darauf konzentriert, Claudes Fähigkeiten für komplexe Aufgaben wie Forschung und Programmierung zu verbessern, sogar das Schreiben ganzer Codebasen.“
Die Preisgestaltung bleibt konsistent mit früheren Opus- und Sonnet-Modellen: Opus 4 kostet 15/75 Dollar pro Million Tokens (Input/Output) und Sonnet 4 3/15 Dollar. Die Modelle sind über die Pro-, Max-, Team- und Enterprise-Pläne von Claude verfügbar, wobei Sonnet 4 auch kostenlosen Nutzern zur Verfügung steht.
Mit Claude 4 positioniert sich Anthropic strategisch im intensiven KI-Wettrüsten, das zwischen Startups und Technologiegiganten stattfindet – ein Markt, der voraussichtlich innerhalb eines Jahrzehnts über 1 Billion Dollar Umsatz erreichen wird. Die neuen Modelle demonstrieren einen klaren Fokus auf praktische Anwendungen und langfristige Aufgabenbewältigung, was sie von reinen Chatbot-Lösungen unterscheidet.