2023年7月26日(現地時間)- Stability AIチームは、SDXL 1.0のリリースを発表しました。このSDXLのフルバージョンは、先月のSDXL 0.9の限定的な研究専用リリースから改良され、世界最高のオープン画像生成モデルとしてリリースされました。
SDXL 1.0
■Stability AIが提供する最高の画像モデル
SDXL 1.0は、Stability AIのフラッグシップ画像モデルであり、画像生成のための最高のオープンモデルです。Stability AI は、他のさまざまなモデルと比較テストした結果、SDXL 1.0によって生成された画像は、他のオープンモデルよりも人々に評価されているという決定的な結果が得られたとしています。
■挑戦的なコンセプトやスタイルに対応
SDXLは、事実上どのようなアートスタイルでも高品質の画像を生成することができるフォトリアリズムのためのオープンモデルです。モデルによって特定の “feel” が付与されることなく、異なるイメージをプロンプトすることができ、スタイルの絶対的な自由度が保証されます。
SDXL 1.0は、前モデルよりも、コントラスト、ライティング、シャドウが鮮やかで正確な色彩になるように調整されており、すべてネイティブ1024×1024の解像度で生成することができます。
さらに、SDXLは、手とテキストや空間的に配置された構図(たとえば、前景で犬を追いかける背景の女性)など、イメージモデルによるレンダリングが困難なコンセプトの生成が可能です。
■シンプルなプロンプトで高品質な出力
SDXLでは、複雑で詳細な、美しい画像を作成するために必要な言葉はわずかでよくなります。ユーザーは、高品質の画像を得るために「masterpiece」などの修飾語を使用する必要がなくなります。さらに、SDXLは「The Red Square」(有名な場所)と「red square」(形状)のような概念の違いも理解することができるようになっています。
■微調整と高度な制御
SDXL 1.0では、カスタムデータに対するモデルの微調整がこれまで以上に簡単になりました。カスタムLoRAやチェックポイントは、データ調整の必要性を減らして生成することができます。Stability AIチームは、SDXLに特化したT2I / ControlNetを使用して、タスク固有の構造、スタイル、コンポジションコントロールの次世代を構築しています。これらの機能は現在ベータ版プレビューですが、微調整のアップデートに期待してくださいとのことです。
SDXLでの画像コントロールは近日公開予定となっています。
詳細について
SDXL 1.0は、3.5Bのパラメータベースモデルと6.6Bのパラメータリファイナーから構成される革新的な新アーキテクチャに基づいて構築されており、オープンアクセス画像モデルの中でも最大級のパラメータ数を誇ります。
完全なモデルは、latent diffusion のための mixture-of-experts パイプラインで構成されています:最初のステップでは、基本モデルが(ノイズの多い)潜在値を生成し、最終的なノイズ除去ステップに特化した精密化モデルでさらに処理されます。ベースモデルはスタンドアローンモジュールとしても使用できます。
この2段階のアーキテクチャにより、速度を犠牲にしたり、過剰な計算リソースを必要としたりすることなく、堅牢な画像生成が可能になります。SDXL 1.0は、8GBのVRAMを搭載したコンシューマー向けGPUや、すぐに利用可能なクラウドインスタンスで効果的に動作するとされています。
SDXL 1.0 の利用方法
SDXL 1.0 次のような方法で利用できます。
- Clipdropを使用。
- DreamStudioでは、SDXL 1.0を画像生成にも利用できます。
- SDXL 1.0の関連するソースコードは、Stability AI GitHubページで公開されています。ウェイトはhuggingfaceからダウンロード可能です。
- SDXL-base-1.0: An improved version over
SDXL-base-0.9
. - SDXL-refiner-1.0: An improved version over
SDXL-refiner-0.9
.
- SDXL-base-1.0: An improved version over
- SDXL 1.0は、 Stability AI Platform でAPIとしても公開されています。
- SDXL 1.0は AWS Sagemakerと AWS Bedrockで利用可能です。
- Stable Foundation Discordでは、SDXLモデルのライブテストを受け付けています。
SDXL 1.0は、CreativeML OpenRAIL++-Mライセンスの下でリリースされています。このライセンスの詳細はこちらから
コメント