Anthropic hat ein neues KI-Spitzenmodell namens Claude 3.7 Sonnet vorgestellt, das mit einer integrierten Reasoning-Fähigkeit ausgestattet ist. Nutzer können selbst entscheiden, ob das Modell in Echtzeit antworten oder länger Ă¼ber komplexe Fragen nachdenken soll.
Das als „Hybrid-KI-Reasoning-Modell“ bezeichnete System markiert einen Paradigmenwechsel, da es sowohl schnelle als auch durchdachte Antworten in einem einzigen Modell vereint. Anthropic verfolgt damit das Ziel, die Benutzeroberfläche seiner KI-Produkte zu vereinfachen. Statt Nutzern die Auswahl zwischen verschiedenen KI-Modellen mit unterschiedlichen Fähigkeiten und Kosten zu Ă¼berlassen, setzt das Unternehmen auf eine All-in-One-Lösung.
Claude 3.7 Sonnet wird ab sofort allen Nutzern und Entwicklern zur VerfĂ¼gung gestellt, wobei die erweiterten Denkfunktionen nur Premium-Kunden vorbehalten bleiben. Kostenlose Nutzer erhalten Zugriff auf die Standardversion, die laut Anthropic bereits leistungsfähiger als das Vorgängermodell Claude 3.5 Sonnet sei.
Die Nutzung des neuen Modells kostet 3 Dollar pro Million Eingabe-Tokens (etwa 750.000 Wörter) und 15 Dollar pro Million Ausgabe-Tokens. Damit ist es teurer als OpenAIs o3-mini (1,10 Dollar/4,40 Dollar) und DeepSeeks R1 (0,55 Dollar/2,19 Dollar).
Technologie des „Denkens“
Claude 3.7 Sonnet gehört zu einer neuen Generation von KI-Modellen, die zum „Reasoning“ fähig sind. Das Modell zerlegt komplexe Probleme in kleinere Schritte, was die Genauigkeit der Ergebnisse verbessern soll.
Anthropic will langfristig erreichen, dass Claude selbstständig entscheidet, wie lange es Ă¼ber bestimmte Fragen nachdenken sollte. „Ă„hnlich wie Menschen nicht zwei separate Gehirne fĂ¼r Fragen haben, die sofort beantwortet werden können, und solche, die Nachdenken erfordern“, erklärte das Unternehmen in einem Blogbeitrag.
Leistungsfähigkeit und Anwendungsgebiete
In Benchmarks fĂ¼r reale Coding-Aufgaben erreichte Claude 3.7 Sonnet eine Genauigkeit von 62,3 Prozent, verglichen mit 49,3 Prozent bei OpenAIs o3-mini. Bei Tests zur Interaktion mit simulierten Nutzern und externen APIs im Einzelhandel (TAU-Bench) erzielte es 81,2 Prozent gegenĂ¼ber 73,5 Prozent bei OpenAIs o1-Modell.
Anthropic betont zudem, dass das neue Modell seltener Antworten verweigert und besser zwischen schädlichen und harmlosen Anfragen unterscheiden kann. Die unnötigen Verweigerungen wurden demnach im Vergleich zum Vorgängermodell um 45 Prozent reduziert.
Claude Code: Neues Tool fĂ¼r Entwickler
Parallel zum neuen Sprachmodell stellt Anthropic „Claude Code“ vor, ein agentenbasiertes Coding-Tool, das als Research Preview veröffentlicht wird. Es ermöglicht Entwicklern, direkt aus dem Terminal spezifische Aufgaben an Claude zu Ă¼bermitteln. Mit einfachen Befehlen in natĂ¼rlicher Sprache kann das Tool Codeprojekte analysieren, Code-Basen modifizieren und sogar Projekte auf Fehler testen oder zu GitHub-Repositories hinzufĂ¼gen.
Der Zugang zu Claude Code wird zunächst nur einer begrenzten Anzahl von Nutzern gewährt.