Gemini: Googles Antwort auf ChatGPT

Bildquelle: Google DeepMind
Bildquelle: Google DeepMind

In der dynamischen KI-Branche dominiert das Start-up OpenAI mit Textroboter ChatGPT. Google setzt nun aber mit einem mit Spannung erwarteten neuen KI-Sprachmodell zum Konter an. Eine Light-Variante davon wird sogar auf einem Smartphone laufen.

Im Wettlauf bei Künstlicher Intelligenz will sich Google mit dem neuen Sprachmodell Gemini an die Spitze setzen. Das KI-System soll nicht nur mit dem Sprachmodell GPT4 des Konkurrenten OpenAI mithalten, sondern es auch übertreffen. Google-Chef Sundar Pichai sagte am Mittwoch zur Ankündigung von Gemini, dass der Wandel, den man gerade mit der KI erlebe, der «tiefgreifendste in unserem Leben sein wird, weitaus größer als die Umstellung auf das Mobiltelefon oder auf das Internet davor».

Anzeige

Gemini kann nicht nur in einem Chatbot Texte generieren, sondern auch bestimmte Probleme lösen und situationsabhängige Entscheidungen treffen. Es kann auch Informationen aus Fotos und Videos aufnehmen. Google demonstrierte das System mit einem Videochat, bei dem Gemini Zeichnungen und Handgesten des menschlichen Gegenübers sofort erkannte und richtig einordnete.

«Wir bringen Gemini über die Google-Produkte zu Milliarden von Menschen», kündigte der Chef von Google DeepMind, Demis Hassabis, an. Die Google-Tochter war im April 2023 aus dem 2014 zugekauften britischen Start-up DeepMind und der Google-internen KI-Abteilung hervorgegangen. Mit der Integration des bis zu diesem Zeitpunkt weitgehend unabhängig agierenden Start-ups wollte Pichai die KI-Anstrengungen im Google-Konzern bündeln, um entschiedener gegen OpenAI antreten zu können.

Google wird das neue System in drei unterschiedlichen Dimensionen einführen: Gemini Ultra, Gemini Pro und Gemini Nano. Gemini Ultra ist das größte und leistungsfähigste Modell für hochkomplexe Aufgaben. Diese Variante richtet sich vor allem an Unternehmenskunden.

Anzeige

Gemini Pro wird sich an ein breites Publikum wenden und beispielsweise dem Chatbot Google Bard «fortgeschrittenes Denken, Planen, Verstehen und mehr» beibringen. «Dies ist das größte Upgrade für Bard seit seiner Einführung», sagte Hassabis. Bard werde von sofort an in mehr als 170 Ländern und Gebieten auf Englisch verfügbar sein. Google plane aber, in naher Zukunft neue Sprachen und Standorte zu unterstützen.

Die dritte Gemini-Variante Nano bringt das System auf das Topmodell der Google-Smartphones Pixel. «Das Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft», kündigte Hassabis an. Damit lässt sich beispielsweise mit der Recorder App nicht nur gesprochene Sprache aus einem längeren Meeting, einer Vorlesung oder einem Interview aufzeichnen und in Echtzeit in schriftliche Sprache umwandeln. Mit Hilfe von Gemini Nano kann das Pixel dann außerdem ohne Zeitverzögerung eine kompakte Zusammenfassung erstellen. In den kommenden Monaten wird Gemini in weiteren Google-Produkten und Diensten wie Suche, Werbeanzeigen oder dem Chrome-Browser verfügbar sein.

Google arbeitet schon seit Jahren an Anwendungen auf Basis Künstlicher Intelligenz, steht aktuell aber unter Zugzwang, mehr davon preiszugeben. Vor einem Jahr löste das Start-up OpenAI einen neuen Wettstreit bei Künstlicher Intelligenz aus, als es seinen Chat-Bot ChatGPT öffentlich machte. Die Software sorgte für viel Aufsehen, weil sie Sätze wie ein Mensch bilden kann. Sie wird mit gewaltigen Datenmengen trainiert und schätzt Wort für Wort ab, wie ein Satz weitergehen könnte. Das bringt das Risiko mit sich, dass sie völlig falsche Informationen ausgeben kann.

dpa

(Bildquelle: https://deepmind.google/technologies/gemini/#introduction)

Anzeige

Artikel zu diesem Thema

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.