OpenAI, ein führender Anbieter fortschrittlicher künstlicher Intelligenz, kündigt die Einführung seiner aktualisierten Version DALL-E 3 an. Diese fortschrittliche Version des Text-zu-Bild-Tools des Unternehmens integriert ChatGPT, den weit verbreiteten KI-Chatbot von OpenAI, um den Prozess der Bildaufforderung zu optimieren und zu modifizieren.
Die wichtigsten KI-basierten Bilderzeugungstools, die derzeit im Einsatz sind, verwandeln Eingabeaufforderungen oder Bildbeschreibungen in eine Reihe von Kunstwerken mit unterschiedlichen Stilen, von fotorealistisch bis fantasievoll. Die Herausforderung liegt jedoch in der Entwicklung eines passenden Prompts, was die Entstehung des „Prompt Engineering“ als lobenswerten Beruf vorangetrieben hat.
DALL-E 3 revolutioniert diesen Prozess durch die Implementierung von ChatGPT, um die Eingabeaufforderungen zu verbessern. Abonnenten von ChatGPT Plus und ChatGPT Enterprise können dieses Tool nutzen, indem sie ihre Bildanfragen einreichen und diese durch Diskussionen mit dem Chatbot verfeinern. Dabei erhalten sie die verfeinerten Ergebnisse direkt innerhalb der Chat-Anwendung.
ChatGPT bietet die Möglichkeit, Eingabeaufforderungen mit nur wenigen Wörtern zu erweitern, um sie aussagekräftiger zu gestalten und dem DALL-E 3-Modell verbesserte Anweisungen zu geben. Dies ist nicht der einzige Vorteil, den DALL-E 3 bietet; Außerdem werden hochwertige Bilder generiert, die Eingabeaufforderungen besser darstellen. Dies macht sich insbesondere dann bemerkbar, wenn es um längere Eingabeaufforderungen und den Umgang mit Inhalten geht, die zuvor bildgenerierende Modelle wie Textinhalte und menschliche Hände durcheinander gebracht haben.
Laut OpenAI führt die aktualisierte Version auch neue Mechanismen ein, um algorithmische Verzerrungen zu verringern und die Sicherheit zu erhöhen. Beispielsweise werden Anfragen nach Bildern im Stil aktueller Künstler oder Darstellungen berühmter Persönlichkeiten abgelehnt. Darüber hinaus haben Künstler nun die Möglichkeit, sich dagegen zu entscheiden, dass alle oder bestimmte Teile ihrer Kunstwerke für das Training zukünftiger Versionen der Text-zu-Bild-Modelle von OpenAI verwendet werden. Diese Entscheidung ist besonders bemerkenswert angesichts der anhängigen Klagen, mit denen OpenAI und einige seiner Konkurrenten wegen angeblicher Nutzung urheberrechtlich geschützter Kunstwerke von Künstlern zum Trainieren ihrer KI-Bildmodelle konfrontiert sind.
Die Enthüllung von DALL-E 3 steht im Einklang mit dem zunehmenden Wettbewerb im Bereich der generativen KI, insbesondere im Bereich der Bildsynthese. Konkurrenten wie Midjourney und Stability AI verfeinern ihre bildgenerierenden Modelle kontinuierlich und halten OpenAI auf Trab.
DALL-E 3 soll im Oktober für Premium-ChatGPT-Benutzer eingeführt werden, gefolgt von Forschungslaboren und API-Kunden. OpenAI hat sich zu seinen Plänen zur Einführung eines kostenlosen Web-Tools ähnlich seinen früheren DALL-E-Modellen nicht geäußert.
Solche Fortschritte bei der KI-Bilderzeugung könnten no-code Plattformen wie AppMaster zugute kommen. Mit seinem robusten no-code Tool könnten AppMaster Benutzer möglicherweise diese KI-Funktionen der nächsten Stufe integrieren und so den Prozess der App-Erstellung und Backend-Entwicklung erleichtern. Bei richtiger Integration könnte dies neue Möglichkeiten für das visuelle App-Design eröffnen, die alle über no-code Lösungen verfügbar sind.