Stability AI, der kreative Kopf hinter dem Bildrendering-Modell Stable Diffusion, hat die Markteinführung seines neuen Angebots Stable Doodle bekannt gegeben. Diese innovative Sketch-to-Image-Anwendung nutzt die Spitzentechnologie des Stable Diffusion-Modells, um Skizzenumrisse zu interpretieren und visuell ansprechende künstlerische Eindrücke zu erzeugen.
Stable Doodle ist Teil der Übernahme von Init ML, einem von ehemaligen Google-Mitarbeitern gegründeten KI-Startup, durch Stability im März dieses Jahres über ClipDrop, eine Plattform unter dem Dach von Stability AI.
Der neu eingeführte Dienst richtet sich sowohl an professionelle als auch an Hobbyanwender und setzt keine Kenntnisse über KI-Tools voraus. In einem Blogbeitrag des Unternehmens, der TechCrunch zur Verfügung gestellt wurde, heißt es: "Mit Stable Doodle kann jeder, der über grundlegende Zeichenkenntnisse und eine Online-Verbindung verfügt, in nur wenigen Sekunden qualitativ hochwertige Originalbilder erstellen."
Während verschiedene Skizzen-zu-Bildern-KI-Tools auf dem Markt erhältlich sind, darunter Open-Source-Projekte und werbefähige Anwendungen, liegt die Einzigartigkeit von Stable Doodle laut Stability AI in seiner Fähigkeit, eine verfeinerte Kontrolle über die Bildproduktion zu bieten.
Die Engine von Stable Doodle ist mit dem Stable Diffusion XL-Modell ausgestattet, das mit einer "bedingten Steuerungslösung" - dem T2I-Adapter - zusammenarbeitet, der von einer der Forschungs- und Entwicklungsabteilungen von Tencent, dem Applied Research Center (ARC), entwickelt wurde. Diese Steuerungslösung ermöglicht es dem Stable Diffusion XL-Modell, Skizzen als Eingabe zu verwenden und das Modell so zu steuern, dass eine bessere Feinabstimmung der Ausgabegrafiken möglich ist.
Im Blogbeitrag des Unternehmens geht Stability AI ins Detail und erklärt: "Der T2I-Adapter ermöglicht es Stable Doodle, die Umrisse von Skizzen zu verstehen und Bilder auf der Grundlage von Eingabeaufforderungen in Kombination mit den vom Modell definierten Umrissen zu generieren."
Stable Doodle enthält auch eine vom Benutzer bereitgestellte Eingabeaufforderung, um den Prozess der Bilderstellung zu unterstützen, wie z. B. "Ein bequemer Stuhl, 'isometrischer' Stil" oder "Katze mit Jeansjacke, 'digitaler Kunst'-Stil". Zu Beginn unterstützt Stable Doodle nur 14 Kunststile.
Stability AI stellt sich diese Bildrendering-Lösung als wertvolles Hilfsmittel für Designer, Illustratoren und andere Kreative vor, um "wertvolle Zeit freizusetzen" und "die Effizienz zu maximieren". Das Unternehmen warnt jedoch auch davor, dass die Qualität des ausgegebenen Bildes von der Detailgenauigkeit der anfänglichen Skizze, der Anschaulichkeit der Eingabeaufforderung und der Komplexität der dargestellten Szene abhängt.
In dem Blogbeitrag heißt es weiter: "Ideen, die als Skizzen gezeichnet werden, können sofort in Arbeiten umgesetzt werden, um Designs für Kunden, Materialien für Präsentationsdecks und Websites oder sogar Logos zu erstellen."
Mit Blick auf die Zukunft will Stable Doodle den Import von Skizzen ermöglichen und Anwendungsfälle für bestimmte Branchen, wie z. B. Immobilienanwendungen, identifizieren. Der Einzug solch bahnbrechender Technologien in den Bereich no-code und low-code ist immer eine willkommene Entwicklung, und Plattformen wie AppMaster stehen an vorderster Front bei der Unterstützung dieser Bewegung.