2023年9月21日 – Open AI は、新しいテキストから画像へのAIモデル「DALL-E 3」を発表しました。
DALL-E 3 について
最近のテキスト画像変換システムは、単語や説明を無視する傾向があり、ユーザーはプロンプトエンジニアリングを学ぶことを求められます。DALL-E 3 は、提供されたテキストに忠実な画像を生成する能力が飛躍的に向上しており、従来のシステムよりもはるかに多くのニュアンスと詳細を理解し、アイデアを非常に正確な画像に簡単に変換することができるようになっているとのことです。
ChatGPTから使用可能に
DALL-E 3 は ChatGPT 上でネイティブに構築されており、ChatGPT をブレインストーミングのパートナーやプロンプトのリファイナーとして使用することができます。
アイデアがあれば、ChatGPTはあなたのアイデアを実現するために、DALL-E 3に合わせた詳細なプロンプトを自動生成します。特定のイメージが気に入ったけれど、ちょっと違う…という場合は、ChatGPTに一言添えるだけで微調整を依頼することができます。
安全へのこだわり
以前のバージョンと同様に、DALL・E 3でも暴力的、成人向け、または憎悪に満ちたコンテンツを生成する能力を制限する措置が講じられています。
■有害な生成の防止
DALL-E 3 は、公人の名前を要求する要求を拒否する緩和策を備えています。レッドチーマー(モデルのストレステストを行うドメインの専門家)との協力により、公人の生成や視覚的な過不足に関連する有害なバイアスのようなリスク領域における安全性能を向上させ、プロパガンダや誤報のような領域におけるリスク評価と緩和の取り組みに役立てています。
■内部テスト
またOpen AI は、画像がAIによって作成されたものであることを人々が識別できるようにするための最良の方法を研究しています。ある画像がDALL-E 3によって生成されたかどうかを識別するのに役立つ新しい内部ツールである出所分類器を実験しており、このツールを使って、生成された画像がどのように使用されるかをより深く理解したいとしています。
クリエイティブ・コントロール
DALL-E 3は、現存するアーティストのスタイルで画像を要求するリクエストを拒否するように設計されています。クリエイターは、将来の画像生成モデルのトレーニングから自分の画像を除外することもできるようになりました。
提供時期
DALL-E 3 は現在リサーチプレビュー中で、ChatGPT Plus と Enterprise のユーザーには10月にAPI 経由で、Labsでは今秋以降に提供される予定です。
コメント