Neuer KI-König?

Wachablösung? Claude 3 Opus überholt GPT-4 in neuen Tests

28. März, 2024
12:20

Bildquelle: Robert Way /Shutterstock.com

Facebook X LinkedIn Reddit WhatsApp Pocket

Claude 3 Opus ist das neueste KI-Modell aus dem Hause Anthropic, in das auch Amazon aggressiv investiert. Jetzt hat es den bisherigen Spitzenreiter GPT-4 von OpenAI in der renommierten „Chatbot-Arena“ überholt und sich den ersten Platz in der Rangliste gesichert.

Die Chatbot-Arena: Ein Wettkampf der KI-Titanen

Die Chatbot-Arena wird von LMSys organisiert, einer Organisation für Großmodellsysteme. Sie bietet eine Plattform, auf der verschiedene KI-Modelle in anonymisierten und zufällig ausgewählten Duellen gegeneinander antreten. Im Gegensatz zu anderen Benchmarking-Methoden für KI-Modelle basiert die LMSYS Chatbot Arena auf den Stimmen von Menschen. Diese bewerten ohne Vorwissen die Ergebnisse zweier verschiedener Modelle und reihen sie entsprechend ein. Seit ihrer Einführung im Mai letzten Jahres hat die Arena über 400.000 Nutzerstimmen gesammelt.

Die Arena nutzt das Elo-Bewertungssystem, das vor allem aus dem Schach bekannt ist, um die relative Leistungsfähigkeit der Chatbots zu bewerten. Die Arena bietet damit eine spannende Perspektive auf die Fähigkeiten und das Nutzererlebnis der verschiedenen KI-Modelle.

Über 70.000 neue Stimmen bildeten das letzte Update, bei dem Claude 3 Opus den Spitzenplatz der Rangliste eroberte, aber selbst das kleinste der Claude-3-Modelle „Haiku“ schnitt gut ab. LMSys erklärte: „Claude-3 Haiku hat alle beeindruckt und erreicht nach unserer Nutzerpräferenz das Niveau von GPT-4! Seine Geschwindigkeit, Fähigkeiten und Kontextlänge sind nun auf dem Markt unübertroffen.“

https://twitter.com/lmsysorg/status/1772759835714728217

Die Dominanz von Anthropics Claude-Modellen in der aktuellen KI-Landschaft könnte auf eine Verschiebung hindeuten, bei der nicht mehr nur die Größe des Modells, sondern auch Effizienz und Anpassungsfähigkeit an die Nutzerpräferenzen zählen. Während OpenAI mit der Einführung von GPT-5 einen weiteren Durchbruch erwartet, zeigt der Erfolg von Claude 3 Opus und seinen Geschwistern, dass die Konkurrenz im Bereich der KI-Chatbots lebendiger und unberechenbarer ist denn je.

Generative KI GPT-4

Wachablösung? Claude 3 Opus überholt GPT-4 in neuen Tests

Die Chatbot-Arena: Ein Wettkampf der KI-Titanen

Lars

Becker

Weitere Artikel

Events

Jobs

Meistgelesene Artikel

Trade Republic erneut down: Tausende Störungsmeldungen

Trade Republic down: Investment-App kämpft mit Störungen

X down – schon wieder! Tausende Nutzer melden Störungen

Wegen US-Zöllen: Baerbock fordert 10 Cent pro iPhone-Update

6 Millionen Datensätze: Oracle wurde angeblich gehackt

IT Verlag

Wichtige Links

Kontakt