Stability AI hat Stable Diffusion 3 angekündigt. Der KI-Bild-Generator soll das bisher leistungsstärkstes Text-zu-Bild-Modell des Unternehmens sein und sogar Prompts für Text in Bildern korrekt wiedergeben.
“Heute eröffnen wir die Warteliste für eine frühe Vorschau. Diese Phase ist entscheidend, um Erkenntnisse zur Verbesserung der Leistung und Sicherheit vor der Veröffentlichung zu gewinnen”, schreiben die Entwickler auf X.
Stable Diffusion 3.0 ist nicht nur eine neue Version, sondern basiert auf einer neuen Architektur. Die KI benutzt die “diffusion transformer architecture”, um die Leistung bei Aufforderungen mit mehreren Themen, die Bildqualität und die Rechtschreibfähigkeiten erheblich zu verbessern. Das könnte KI-Bilder auf das nächste Level heben, denn das Einfügen von Text ist bei nahezu allen Bildgeneratoren ein riesiges Problem. Die vorgestellten Bilder von Stability AI zeigen, dass Stable Diffusion 3 genau das jetzt kann.
Für das Stable Diffusion 3-Bild wurde folgender Prompt verwendet: Prompt: “Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3″ made out of colorful energy”
Das Modell ist zwar noch nicht allgemein verfügbar, aber es wurde eine Warteliste für eine frühe Vorschau erstellt.