Meta hat am Wochenende die neueste Generation seiner großen Sprachmodelle (LLM) vorgestellt. Mit Llama 4 Scout und Llama 4 Maverick präsentiert der Konzern, was er als seine „fortschrittlichsten Modelle bisher“ und „die besten ihrer Klasse für Multimodalität“ bezeichnet.
Beide Modelle sind Teil der breiteren Strategie des Unternehmens, Open-Source-KI-Tools zu entwickeln. Die neuen Sprachmodelle können laut Meta verschiedene Datentypen verarbeiten und generieren – darunter Text, Bilder, Video und Audio. Dies macht sie zu vollständig multimodalen Systemen. „Diese Llama 4-Modelle markieren den Beginn einer neuen Ära für das Llama-Ökosystem“, schrieb Meta in einem Blog-Post. „Dies ist nur der Anfang für die Llama 4 Kollektion“.
Llama 4 Scout verfügt über ein Kontextfenster von 10 Millionen Token. Meta behauptet, dass Scout Googles Gemma 3 und Gemini 2.0 Flash-Lite sowie den Open-Source-Konkurrenten Mistral 3.1 „bei einer breiten Palette von häufig berichteten Benchmarks“ übertreffen kann. Trotz seiner Leistungsfähigkeit soll das Modell kompakt genug sein, um auf einer einzelnen Nvidia H100 GPU zu laufen.
Das größere Llama 4 Maverick-Modell wurde entwickelt, um mit OpenAIs GPT-4o und Googles Gemini 2.0 Flash zu konkurrieren. Meta gibt an, dass Maverick bei Programmier- und Reasoning-Aufgaben vergleichbare Ergebnisse wie DeepSeek-V3 liefert, dabei aber „weniger als die Hälfte der aktiven Parameter“ benötigt.
Llama 4 „Behemoth“ als Lehrer-Modell
Zusätzlich kündigte Meta ein Vorschaumodell namens Llama 4 Behemoth an, das als „eines der intelligentesten LLMs der Welt und unser bisher leistungsstärkstes Modell“ beschrieben wird. Behemoth soll laut Unternehmen als „Lehrer“ für die neuen Modelle dienen.
Das fortlaufend trainierte Behemoth-Modell wird insgesamt 2 Billionen Parameter enthalten, von denen 288 Milliarden jederzeit aktiv sein sollen. Das Modell, das eine „Mixture of Experts“ (MoE)-Architektur zur Optimierung der Ressourcennutzung einsetzt, soll GPT-4.5 und Claude Sonnet 3.7 „bei mehreren STEM-Benchmarks“ übertreffen.
Meta-CEO Mark Zuckerberg bezeichnet Behemoth als „das leistungsstärkste Basis-Modell der Welt“. Weitere technische Details und Produktankündigungen will das Unternehmen während seiner kommenden Entwicklerveranstaltung LlamaCon am 29. April vorstellen.
Die Entwicklung von Llama 4 verlief nicht ohne Schwierigkeiten. Laut einem Bericht von The Information verzögerte Meta die Veröffentlichung aufgrund anfänglicher Leistungsprobleme beim logischen Denken und bei mathematischen Aufgaben. Zudem gab es Bedenken, dass die Modelle bei der Generierung menschenähnlicher Sprachkonversationen weniger leistungsfähig seien als die von OpenAI.
Scout und Maverick sind auf Llama.com und bei Metas Partnern, einschließlich der KI-Entwicklungsplattform Hugging Face, verfügbar, während Behemoth noch in der Entwicklung ist. Meta sagt, dass Meta AI, sein KI-gestützter Assistent für Apps wie WhatsApp, Messenger und Instagram, aktualisiert wurde, um Llama 4 in 40 Ländern zu verwenden. Multimodale Funktionen sind vorerst auf die USA in englischer Sprache beschränkt.