Stability AI、「Stable Diffusion 3」とチャットbot「Stable Assistant」発表
2024年4月18日(木)8時2分 ITmedia NEWS
Stable Diffusion 3に「夜明けに山頂にいる魔術師が、魔法で大きな「Stable Diffusion 3 API」という文字を日の出の光の中に描いている素晴らしい作品」というプロンプトで生成させた画像
Stable Diffusion新版を提供する開発者プラットフォームは、米APIプラットフォーム企業Fireworks AIとの提携で提供する。将来的にはStability AIのメンバーシップを通じてモデルの重みを自社サーバでホストできるようにする計画という。
タイポグラフィ(文字デザイン)とプロンプトの忠実度で米OpenAIの「DALL・E 3」や米Midjourneyの「Midjourney v6」などの競合するテキストから画像への生成AIと同等かそれらを上回るとしている。
新版は新しいMultimodal Diffusion Transformer(MMDiT)アーキテクチャを採用し、画像と言語の表現に別々の重みセットを使うため、旧版と比較してテキストの理解とスペルの能力が向上したという。
APIでの提供と並行して、Stable Diffusion 3を搭載したStable Assistantのβ版の初期リリースに限られた数のユーザーを招待している。
新版を一般に公開しないのは、「悪意ある者による悪用を防ぐため」。研究者や専門家、コミュニティと継続的に協力することで、モデルの改善を続けるとしている。
Stability AI Developer Platform APIは専用サイトで確認できる。