2024年6月12日(現地時間)- Stability AI は、画像生成モデル『Stable Diffusion 3 Medium』のリリースを発表しました。
Stable Diffusion 3 Medium とは
『Stable Diffusion 3 Medium』は、Stable Diffusion 3シリーズの最新かつ最も高度なテキストから画像へのAIモデルです。このモデルは小型であるため、コンシューマーPCやラップトップ、エンタープライズクラスのGPUで実行するのに最適なものとなっており、生成AIの進化における重要なマイルストーンとされています。
■SD3 Medium主な特徴
SD3 Mediumは、20億パラメータのSD3モデルで、以下の特徴を備えています:
- 全体的な品質とフォトリアリズム:ディテール、カラー、ライティングに優れた画像を提供し、フォトリアリスティックな出力や柔軟なスタイルでの高品質な出力を可能にします。16チャンネルVAEなどの技術革新により、手や顔のリアルさなど、他モデルの落とし穴を克服しています。
- プロンプトの理解:空間的推論、構成要素、アクション、スタイルを含む、長く複雑なプロンプトを理解します。3つのテキストエンコーダーをすべて、または組み合わせて使用することで、ユーザーはパフォーマンスと効率をトレードオフすることができます。
- タイポグラフィ:Diffusion Transformerアーキテクチャを活用することで、スペル、カーニング、文字組み、スペーシングのミスを低減し、これまでにないテキスト品質を実現します。
- リソース効率:VRAMフットプリントが少ないため、標準的なコンシューマー向けGPUでパフォーマンスを低下させることなく実行するのに理想的です。
- 微調整: 小さなデータセットから微妙なディテールを取り込むことができるため、カスタマイズに最適です。
■NVIDIAとのコラボレーション
Stability AI は、NVIDIA® RTX™ GPUとTensorRT™を活用することで、Stable Diffusion 3 Mediumを含むすべてのStable Diffusionモデルのパフォーマンスを強化するために、NVIDIAと協力しました。TensorRTで最適化されたバージョンは、クラス最高のパフォーマンスを提供し、パフォーマンスが50%向上します。
■AMDとのコラボレーション
AMDは、SD3 Mediumの推論を、AMDの最新のAPU、コンシューマ向けGPU、MI-300XエンタープライズGPUなど、さまざまなAMDデバイスのために最適化しています。
利用方法
- オープンリリースと同時に、Stable Diffusion 3 Mediumは、Fireworks AIが提供するAPI で利用することが可能です。
- 非商用利用のために Hugging Face からダウンロード。
- 商用利用: Contact us からお問い合わせください。
- Stable Assistant と Stable Artisan から試してみることができます。
- FAQ: その他は FAQs をご確認ください。
安全性について
Stability AIは、安全で責任あるAIの実践を信じています。これは、悪質な行為者による Stable Diffusion 3 Medium の悪用を防ぐために、合理的な手段を講じ、それを継続することを意味します。安全性は、モデルのトレーニングを開始した時点から始まり、テスト、評価、デプロイメントを通じて継続します。このモデルの広範な内部および外部テストを実施し、危害を防止するための数多くのセーフガードを開発し、実施してきました。Stability AIは、研究者、専門家、そしてコミュニティと継続的に協力することで、モデルを改善し続けながら、誠実にさらなる革新を進めていくとしています。
Stability AI の安全性へのアプローチについての詳細は、 Stable Safety をご参照ください。
ライセンス
Stable Diffusion 3 Mediumは、オープンな非商用ライセンス(Stability Non-Commercial Research Community License)と商用目的で利用できる低コストのクリエイターライセンスの下で利用可能です。大規模な商用利用のライセンスの詳細についてお問い合わせが必要となります。
今後の展開
Stable Diffusion 3 Medium は、フィードバックに基づき、継続的に改善され、機能を拡張し、パフォーマンスの向上が行われる予定です。Stability AIは、目標はAI生成アートにおける創造性の新たな基準を設定し、Stable Diffusion 3 Medium をプロと趣味利用の方の双方に不可欠なツールにすることとしています。
コメント