In der Vergangenheit wurde der Begriff generative künstliche Intelligenz (KI) vor allem mit Deepfakes und Datenjournalismus in Verbindung gebracht. Doch die Technologie spielt eine immer wichtigere Rolle bei der Automatisierung von sich wiederholenden Prozessen in der digitalen Bild- und Audiokorrektur.
Wann immer KI eigene Inhalte generiert, sei es Text, Bilder oder Multimedia, hat generative KI ihre Finger im Spiel.
Dabei handelt es sich um Technologien, die selbstständig Bilder produzieren und aus den im Internet gesammelten Informationen eigenständig Website-Artikel, Artikelzusammenfassungen, Unternehmensbroschüren, Pressemitteilungen und White Paper erstellen. Kurz gesagt, generative KI-Modelle dienen dem Zweck, synthetische Daten zu erzeugen, die einen Turing-Test bestehen können.
Was ist generative KI?
Generative KI ist eine Technologie, die KI und Algorithmen des maschinellen Lernens einsetzt, um Maschinen in die Lage zu versetzen, aus vorhandenen Texten, Audiodateien, Bildern oder Originalmustern Inhalte zu erstellen. Bei der generativen KI verwenden Computer ihre Trainingsdaten, um das zugrundeliegende Muster zu erkennen, das mit der Eingabe verbunden ist, und Inhalte so zu produzieren, dass die Benutzer sie für echt halten. Was bisher dem Menschen vorbehalten war, nämlich das Erzeugen von Artefakten, kann nun die generative KI leisten. Dabei liefert sie originelle Ergebnisse, die auf menschlichem Denken und menschlicher Erfahrung beruhen, und zwar ohne Voreingenommenheit. So kann generative KI beispielsweise Inhalte erstellen, die den Anschein erwecken, von Menschen geschrieben zu sein. Generative KI erstellt automatisch neue Objekte oder Strukturen auf der Grundlage vorhandener Daten und Erkenntnisse, anstatt nur selbstlernende Algorithmen zu verwenden.
Wie funktioniert generative KI?
Bei der generativen KI handelt es sich im Grunde um Programme, die vorhandene Inhalte wie Texte, Audiodateien oder Bilder verwenden, um neue kohärente und überzeugende Inhalte zu erstellen. Die Computer sind in der Lage, das zugrundeliegende Muster in Bezug auf die Eingabe zu erlernen und es dann zu verwenden, um ähnliche Inhalte zu erzeugen. Drei Techniken bilden die Grundlage der generativen KI: Generative Adversarial Networks (GAN), Transformers und Variational Autoencoders.
Generative Adversarial Netzworks (GANs)
GANs bestehen aus zwei neuronalen Netzen – einem Generator und einem Diskriminator. Der Generator ist, wie der Name schon sagt, für die Erzeugung neuer Daten oder Inhalte zuständig, die den Quelldaten ähneln. Der Diskriminator ist für die Unterscheidung zwischen den Quelldaten und den generierten Daten zuständig. In ständig wechselnden Trainingszyklen lernt der Generator fortlaufend, realistischere Daten zu erzeugen, während der Diskriminator trainiert wird, gefälschte Daten von echten Daten zu unterscheiden.
Transformatoren
Transformatoren wie GPT-3, LaMDA und Wu-Dao ahmen die kognitive Aufmerksamkeit nach und messen die Bedeutung der Eingabedaten auf unterschiedliche Weise. Sie werden darauf trainiert, die Sprache oder das Bild zu verstehen, Klassifizierungsaufgaben zu erlernen und Text oder Bilder aus großen Datensätzen zu generieren.
Variational Autoencoder (VAE)
Variational Autoencoder ist eine Deep-Learning-Technik, mit der komplexe generative Datenmodelle entworfen und an große Datensätze angepasst werden können. Diese Technik kann Bilder von fiktiven Gesichtern prominenter Personen und hochauflösende digitale Kunstwerke erstellen. Wie das GAN, so sorgt auch die VAE dafür, dass die Genauigkeit der Ausgabe verbessert wird.
Vom abstrakten Konzept zum täuschend echten Objekt
Laut Gartner geht es bei der generativen KI darum, aktuelle innovative Arbeitsabläufe gemeinsam mit Menschen zu verbessern. Generative KI kann zur Entwicklung von Objekten oder Gegenständen eingesetzt werden, die den Menschen bei der Erfüllung kreativer Aufgaben unterstützen. Sie können jedoch keine völlig neuen Bilder oder Texte erstellen, weil sie das, was sie wissen, auf bestmögliche Weise miteinander kombinieren. Generative KI unterstützt ML-Modelle, befreit sie von Verzerrungen und realisiert abstraktere Konzepte durch Nachahmung der realen Welt. Mit generativer KI erstellte Avatare werden zum Schutz von Personen eingesetzt, die ihre Identität bei Vorstellungsgesprächen, Interviews oder bei der Arbeit nicht preisgeben wollen. Die generative Modellierung kann sicherstellen, dass Modelle für maschinelles Lernen weniger voreingenommen sind, und es Bots ermöglichen, abstrakte Konzepte in Simulationen und in der realen Welt zu verstehen.
Aus Alt mach Neu
Generative KI erzeugt realistisch aussehende Fotos von menschlichen Gesichtern, Objekten und Szenen. Das Anwendungsszenario in der Film- und Werbeindustrie ist deshalb breit gefächert. Bilder, die bei schlechten Licht- oder Wetterbedingungen aufgenommen wurden, können in die gewünschten Bedingungen umgewandelt werden. Sie ändert Farbbilder in Schwarz-Weiß-Bilder und Fotos bei Tag in Fotos bei Nacht. Mit Hilfe von Gesichtssynthese und Stimmenklonen kann die Originalstimme des Schauspielers mit einer Lippensynchronisation abgeglichen werden. Generative KI kann alte, niedrig aufgelöste Bilder und Filme durch Hochskalierung auf 4K und höher verbessern, um genauere, klarere und detailliertere Bilder zu erhalten. Sie erzeugt 60 Bilder pro Sekunde anstelle von 23 oder weniger, beseitigt Rauschen und fügt Farbe hinzu.
Optimierte Gesichtsidentifizierung und Suchergebnisse
Generative KI wandelt Eingaben in Form von semantischen Bildern oder Skizzen in fotorealistische Bilder um. Bei der Erzeugung von Frontalansichten von Gesichtern generiert die generative KI Frontalfotos aus Fotos, die aus verschiedenen Winkeln aufgenommen wurden, zwecks Optimierung von Systemen zur Gesichtsüberprüfung oder -identifizierung. Andere Anwendungsfälle sind die Umwandlung von realen Fotos in Emojis oder in kleine Cartoon-Gesichter oder die Alterung von Gesichtern auf der Grundlage eines Fotos eines jungen Gesichts. Generative KI ist auch in der Lage, Suchmaschinendienste beispielsweise durch Text-zu-Bild-Übersetzung auf die nächste Stufe zu heben. Sie erzeugt realistische Fotografien aus Textbeschreibungen von Objekten wie z.B. Vögeln und Blumen.
Bessere Auswertung von Röntgenbildern und optimierten Prothesen
Im Gesundheitswesen kann generative KI beispielsweise zur Früherkennung bösartiger Tumore eingesetzt werden, indem das Generative Adversarial Networks Modeling (GAN) verschiedene Winkel einer Röntgenaufnahme berechnet, um das mögliche Ausmaß des Tumors zu visualisieren. Mediziner können mit Hilfe von maschinellem Lernen das Verhalten und die Bewegungsmuster von Patienten beobachten, bevor sie mit Hilfe generativer KI das Design der Prothese berechnen und eine perfekte Prothese entwickeln.
Mehr als nur Anzeigentexte
Generative KI spielt auch bei der Texterstellung eine nicht zu unterschätzende Rolle. Mittlerweile gibt es schon Tools, deren Fähigkeiten über das Generieren von Anzeigenzeilen, Produktbeschreibungen und Betreffzeilen für Outreach-Kampagnen hinausgehen. Dazu benötigt man nur noch eine Reihe von Schlüsselwörtern und die KI erstellt im Handumdrehen einen kompletten Text. Die Tools können auch analysieren, welche Texte am erfolgreichsten sind und dementsprechend neue, ähnlich konzipierte, aber bessere Texte verfassen. Die britische Zeitung „The Guardian“ hat bereits versuchsweise generative KI benutzt, um einen Aufsatz von Grund auf zu schreiben, mit einem aus Sicht der Journalisten besorgniserregenden Ergebnis.
Maschinenbasierte Kunstwerke
Ein weiterer interessanter Anwendungsbereich sind nicht-fungible Token (NFTs), die derzeit boomen und einen der lukrativsten Märkte in der Krypto Welt darstellen. Der neueste Trend sind nicht mehr Karikaturen, sondern maschinenbasierte Kunstwerke, die mit generativer KI und menschlicher Vorstellungskraft erstellt werden. Sogenannte KI-Kunstgeneratoren können Text in Kunst verwandeln oder Bilder zu einem neuen Foto kombinieren.
Vielversprechende Aussichten
Mit generativer KI können Muster in einem bestimmten Inhalt erkannt werden, um neue, qualitativ hochwertige Objekte und Gegenstände durch Selbstlernen aus jedem Datensatz zu erschaffen. Unterschiedliche Ausprägungen der generativen KI haben sich bereits in verschiedenen Anwendungsbereichen als sehr nützlich erwiesen, z. B. in der Bildproduktion, der Filmrestaurierung und der Erstellung von 3D-Umgebungen. Angesichts ihrer besonderen Fähigkeiten, synthetische Daten zu erzeugen, um ihre eigenen Modelle zu trainieren, gilt generative KI als einer der vielversprechendsten Fortschritte in der Welt der KI. Während die bisher verwendeten KI-Modelle Aufgaben ausführen, die auf ein bestimmtes Ergebnis hin trainiert wurden, bringt die generative KI eine ganz neue Dynamik ins Spiel, da ihre Algorithmen eine realistische, neuartige Version dessen erstellen können, wofür sie trainiert wurden.