Ein bedeutender Abgang bei OpenAI könnte den aufstrebenden Rivalen Anthropic stärken. Jan Leike, der als Co-Leiter des OpenAI-Sicherheitsteams „Superalignment“ für Aufsehen sorgte, wechselt zu Anthropic. Dort wird er eine neue Arbeitsgruppe zu KI-Sicherheit und Kontrollierbarkeit leiten.
Leike hatte OpenAI Anfang Mai mit deutlicher Kritik an der Firmenausrichtung in puncto KI-Sicherheit verlassen. Bei Anthropic soll er sich nun auf Themen wie „skalierbare Aufsicht“, „Generalisierung schwacher zu starker KI“ und automatische Anpassung der KI-Ziele konzentrieren.
Der Zug des gefragten Forschers ist ein Coup für Anthropic. Das vom OpenAI-Mitgründer Dario Amodei 2021 gegründete Start-up versucht sich mit Claude als verantwortungsbewusstere Alternative zum kommerziell orientierten OpenAI zu positionieren. Mehrere Ex-Kollegen Amodeis aus der OpenAI-Frühphase arbeiten bereits bei Anthropic.
Für OpenAI ist Leikes Abgang ein personeller Rückschlag in der zentralen Frage der Sicherheitskontrollen für superintelligente Systeme. Das ehemalige „Superalignment“-Team wurde gerade aufgelöst, da Führungskräfte dessen ambitionierte Ziele wie die Bewältigung technischer KI-Kontrollherausforderungen in vier Jahren für unrealistisch hielten.
Anthropic betont die Wichtigkeit von „Aufsichts“-Methoden also, das beabsichtigte Verhalten selbst leistungsstarker KI vorherzusagen und zu steuern. Dies dürfte ein Schwerpunkt von Leikes neuem Team werden, das direkt an den Anthropic-Wissenschaftschef Jared Kaplan berichten wird.