OpenAI rüstet seinen Chatbot ChatGPT mit neuen Bildbearbeitungsfunktionen aus und erweitert dessen Fähigkeiten zur Erstellung von Visualisierungen mit lesbaren Textelementen. Die Neuerungen sollen die Attraktivität des KI-Tools sowohl für geschäftliche als auch private Anwender steigern.
Wie das Unternehmen in einer Livestream-Präsentation vorführte, können Nutzer künftig in dialogbasierter Form Bilder schrittweise anpassen und verändern. So lässt sich beispielsweise nach der Erstellung eines Bildes im Nachgang der Hintergrund modifizieren oder Elemente wie eine Kopfbedeckung hinzufügen.
Ein weiterer Fokus liegt auf der verbesserten Textintegration in generierte Bilder. Dies soll die Erstellung von Diagrammen, Infografiken und Logos für den professionellen Einsatz erleichtern. Die KI sei zudem in der Lage, komplexere Anweisungen zur Bildkomposition umzusetzen.
Die neuen Funktionen werden ab heute über OpenAIs GPT-4o-Modell verfügbar sein und stehen sowohl kostenlosen als auch zahlenden Nutzern zur Verfügung. Das Unternehmen kündigte an, die neuen Features in den kommenden Wochen auch für Softwareentwickler bereitzustellen, die die API nutzen.
Wie bei anderen KI-Anwendungen bestehen jedoch technische Einschränkungen. So kann es laut OpenAI zu Fehlern kommen, etwa durch die Generierung falscher Textinhalte wie nicht existierende Ländernamen. Ein Unternehmensblogpost weist darauf hin, dass solche Probleme besonders bei unspezifischen Anfragen auftreten können. Weitere Herausforderungen seien die Darstellung kleiner Schriftgrößen und nicht-lateinischer Schriftsysteme.
Die Bilderstellung mit den erweiterten Funktionen benötigt bis zu einer Minute Verarbeitungszeit, was CEO Sam Altman mit dem höheren Detailgrad der Ausgaben begründet.