画像レンダリングモデル「Stable Diffusion」を開発するStability AIは、斬新なアプリケーション「Stable Doodle」の発売を発表しました。この革新的なスケッチ・トゥ・イメージ・アプリケーションは、Stable Diffusionモデルの最先端技術を採用し、スケッチの輪郭を解釈し、視覚的に印象的な芸術的印象を生成します。
Stable Doodleは、Stability AI傘下のプラットフォームであるClipDropを通じて、今年3月にStabilityがInit ML(元グーグルの従業員によって設立されたAIスタートアップ)を買収した一環として提供される。
新たに開始されたサービスは、プロとアマチュアの両方のユーザーを対象としており、AIツールに精通している必要はない。TechCrunchが公開した同社のブログ記事によると、"Stable Doodleを使えば、基本的な描画スキルとオンライン接続さえあれば、誰でも高品質なオリジナル画像をわずか数秒で生成できる"。
オープンソースプロジェクトや広告対応アプリケーションを含め、様々なスケッチから画像へのAIツールが市場に出回っているが、Stable Doodleの独自性は、Stability AIが提供するように、画像生成に対する洗練された制御を提供する能力にある。
Stable DoodleのエンジンにはStable Diffusion XLモデルが搭載されており、テンセントの研究開発部門のひとつであるApplied Research Center(ARC)が開発した「条件付き制御ソリューション」T2I-Adapterと連動して動作する。この制御ソリューションにより、Stable Diffusion XLモデルはスケッチを入力として受け取ることができ、出力アートワークの優れた微調整を可能にするようモデルをガイドする。
T2I-Adapterにより、Stable Doodleはスケッチのアウトラインを理解し、モデルによって定義されたアウトラインと組み合わされたプロンプトに基づいて画像を生成することができます。
また、Stable Doodleは、"快適な椅子、「アイソメトリック」スタイル "や "ジーンズジャケットを着た猫、「デジタルアート」スタイル "など、画像作成プロセスを支援するために、ユーザーが提供するプロンプトも組み込んでいる。Stable Doodleは当初、14種類のスタイルしかサポートしていない。
この画像レンダリングソリューションは、デザイナー、イラストレーター、その他のクリエイターにとって、"貴重な時間を解放し"、"効率を最大化する "ための貴重な資産となることをStability AIは想定している。しかし、同社は、出力画像の品質は、最初のスケッチの詳細、プロンプトの描写力、描かれたシーンの複雑さに依存するとも警告している。
スケッチとして描かれたアイデアは、即座にクライアントのためのデザイン、プレゼンテーション・デッキやウェブサイトの資料、あるいはロゴを作成するための作品に変換することができます "とブログポストはさらに言及している。
今後、Stable Doodleは、スケッチのインポートを可能にし、不動産アプリケーションのような特定の産業分野での使用例を特定することを目指している。必ず、このような画期的な技術がno-code やlow-code のスペースに参入することは歓迎すべきことであり、AppMasterのようなプラットフォームは、この動きをサポートする最前線にいる。