DALL·E 3は、OpenAIが開発した画像生成AIで、テキスト入力に基づいて高品質な画像を生成する機能を提供します。このサービスは、特定のテキストプロンプトから画像を生成することに特化しており、AI技術を活用して新しいビジュアルコンテンツを作成することができます。
DALL·E 3は、以前のシステムよりも細かいニュアンスと詳細を理解することができ、アイデアを非常に正確な画像に簡単に変換することができます。このシステムは、ChatGPT PlusおよびEnterpriseユーザーにすでに提供されており、今秋にはAPIおよびLabs経由で利用可能になる予定です。
DALL·E 3は、同じプロンプトでもDALL·E 2よりも大幅な改善を実現しています。ChatGPTにネイティブに組み込まれており、ChatGPTをブレインストーミングのパートナーとして使用して、プロンプトを洗練させることができます。ChatGPTにアイデアを入力すると、そのアイデアを具体化するためのカスタマイズされた詳細なプロンプトをDALL·E 3が自動生成します。特定の画像が気に入ったが、まだ完璧ではない場合、数語で微調整を依頼することができます。
DALL·E 3では、暴力的、成人向け、または憎悪に満ちたコンテンツの生成を制限する措置が取られています。また、公的人物の名前で要求された場合には、要求を拒否する安全対策が施されており、公的人物の生成や視覚的な過小/過大表現に関連する有害なバイアスのリスク領域における安全性能が向上しています。AIによって生成された画像を特定するための最善の方法についての研究も行われており、新しい内部ツールである出所分類器を実験しています。さらに、DALL·E 3は、生存中のアーティストのスタイルで画像を要求された場合には要求を拒否するように設計されており、クリエイターは自分の画像を今後の画像生成モデルのトレーニングからオプトアウトすることもできます。