OpenAI kündigte die dritte Version seiner generativen KI-Plattform für visuelle Kunst DALL-E an, mit der Benutzer nun ChatGPT zur Erstellung von Prompts verwenden können und die mehr Sicherheitsoptionen enthält.
DALL-E wandelt Textaufforderungen in Bilder um. Aber selbst DALL-E 2 machte Fehler und ignorierte oft bestimmte Formulierungen. Die neueste Version, so die OpenAI-Forscher, versteht den Kontext viel besser.
“DALL-E 3 liefert signifikante Verbesserungen gegenüber DALL-E 2, wenn es darum geht, Text innerhalb eines Bildes und in menschlichen Details wie Händen zu generieren”, schreibt OpenAI auf seiner Webseite, die das neue Modell erklärt. Mit dieser Funktion steht OpenAI in direkter Konkurrenz zu Ideogram, einem im letzten Monat gegründeten Startup von ehemaligen Googlern, das mit seinem eigenen KI-Modell ebenfalls Bilder mit eingebautem Text/Typografie erzeugt. Die meisten Konkurrenten wie Midjourney haben große Probleme dabei, Text innerhalb eines Bildes zum Beispiel in Logos darzustellen.
Wann kommt DALL-E 3 raus?
Diese neue Version von DALL-E wird im Oktober zuerst für ChatGPT Plus- und ChatGPT Enterprise-Benutzer freigegeben, gefolgt von Forschungslabors und dem API-Service im Herbst. OpenAI plant, die Veröffentlichung von DALL-E 3 zeitlich zu staffeln, hat sich aber nicht darauf festgelegt, wann eine kostenlose öffentliche Version erscheinen wird.
OpenAI behauptet, dass es sich bei DALL-E 3 auf die Entwicklung robuster Sicherheitsmaßnahmen konzentriert hat, um die Erstellung von anzüglichen oder potenziell hasserfüllten Bildern zu verhindern. Die neue Ausgabe wird auch nicht in der Lage sein, Bilder von Persönlichkeiten des öffentlichen Lebens nachzubilden – vorausgesetzt, die Eingabeaufforderung nennt ausdrücklich einen Namen.