Neuer KI-König?

Wachablösung? Claude 3 Opus überholt GPT-4 in neuen Tests

Claude 3
Bildquelle: Robert Way /Shutterstock.com

Claude 3 Opus ist das neueste KI-Modell aus dem Hause Anthropic, in das auch Amazon aggressiv investiert. Jetzt hat es den bisherigen Spitzenreiter GPT-4 von OpenAI in der renommierten „Chatbot-Arena“ überholt und sich den ersten Platz in der Rangliste gesichert.

Die Chatbot-Arena: Ein Wettkampf der KI-Titanen

Die Chatbot-Arena wird von LMSys organisiert, einer Organisation für Großmodellsysteme. Sie bietet eine Plattform, auf der verschiedene KI-Modelle in anonymisierten und zufällig ausgewählten Duellen gegeneinander antreten. Im Gegensatz zu anderen Benchmarking-Methoden für KI-Modelle basiert die LMSYS Chatbot Arena auf den Stimmen von Menschen. Diese bewerten ohne Vorwissen die Ergebnisse zweier verschiedener Modelle und reihen sie entsprechend ein. Seit ihrer Einführung im Mai letzten Jahres hat die Arena über 400.000 Nutzerstimmen gesammelt.

Anzeige

Die Arena nutzt das Elo-Bewertungssystem, das vor allem aus dem Schach bekannt ist, um die relative Leistungsfähigkeit der Chatbots zu bewerten. Die Arena bietet damit eine spannende Perspektive auf die Fähigkeiten und das Nutzererlebnis der verschiedenen KI-Modelle.

GJoXWeSaUAA9Waz

Über 70.000 neue Stimmen bildeten das letzte Update, bei dem Claude 3 Opus den Spitzenplatz der Rangliste eroberte, aber selbst das kleinste der Claude-3-Modelle „Haiku“ schnitt gut ab. LMSys erklärte: „Claude-3 Haiku hat alle beeindruckt und erreicht nach unserer Nutzerpräferenz das Niveau von GPT-4! Seine Geschwindigkeit, Fähigkeiten und Kontextlänge sind nun auf dem Markt unübertroffen.“

https://twitter.com/lmsysorg/status/1772759835714728217

Die Dominanz von Anthropics Claude-Modellen in der aktuellen KI-Landschaft könnte auf eine Verschiebung hindeuten, bei der nicht mehr nur die Größe des Modells, sondern auch Effizienz und Anpassungsfähigkeit an die Nutzerpräferenzen zählen. Während OpenAI mit der Einführung von GPT-5 einen weiteren Durchbruch erwartet, zeigt der Erfolg von Claude 3 Opus und seinen Geschwistern, dass die Konkurrenz im Bereich der KI-Chatbots lebendiger und unberechenbarer ist denn je.

Anzeige

Lars

Becker

Redakteur

IT Verlag GmbH

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.