OpenAI、次世代動画生成モデル「Sora 2」を発表!

CGソフト

2025年9月30日(現地時間)- OpenAIは、最新の動画生成モデル「Sora 2」を発表しました。

次世代動画生成モデル「Sora 2」とは

「Sora 2」は、従来のシステムよりも物理的に正確で、現実味があり、より高度な制御が可能な OpenAIの最新の動画生成モデルです。

さらに、この新しいモデルでは、セリフの同期や効果音の生成も可能となっています。

2024年2月に発表された初代Soraモデルは、動画生成における「GPT-1の瞬間」とも言える存在でした。初めて動画生成が本格的に機能し始め、物体の一貫性といった基本的な挙動が、大規模な事前学習によって自然に現れるようになりました。

それ以降、Soraチームは「より高度な世界シミュレーション能力」を持つモデルの開発に力を注いできました。こうしたシステムは、AIが物理世界を深く理解するために欠かせないと考えられており、そのための大きなマイルストーンとなるのが、大規模な動画データを用いた事前学習と事後学習の確立です。これらは言語モデルと比べると、まだ発展の初期段階にあるとされています。

Sora 2の能力

Sora 2は、これまでの動画生成AIを大きく超える能力を持っています。単に美しい映像を作るだけでなく、物理法則を理解し、現実に近い世界をシミュレートすることができます。

物理的に正確で複雑な動きの再現

従来のモデルでは困難だった、物理的に複雑なシーンを正確に生成することができます。例えば、水の浮力や物体の硬さといった物理法則を理解しているため、パドルボードの上で人がバックフリップする際のリアルな動きや、フィギュアスケーターが頭に猫を乗せたままトリプルアクセルを決めるといった、複雑なインタラクションも自然に表現できます。

Prompt: man does a backflip on a paddleboard

成功だけでなく「失敗」もリアルに再現

従来のビデオモデルは過度に楽観的であり、テキストプロンプトに従って正常に動作させるために、オブジェクトを変形させ、現実を歪めてしまう場合が多くありました。Sora 2は、単に指示通りの成功例を作るだけではありません現実世界と同じように、「失敗」もリアルに描き出します。例えば、バスケットボールのシュートが外れた場合、ボールが魔法のようにゴールに入るのではなく、物理法則に従ってバックボードに跳ね返る様子を正確にシミュレートします。これにより、より現実に近い世界のモデル化が可能になります。

Prompt: a dalmatian deftly walks runs and hops his way through a complex obstacle course in burano italy

映画やアニメのような多彩な表現力

単一のビデオだけでなく、複数のショット(カット)にまたがる複雑な指示を正確に理解し、物語の一貫性を保ったまま映像を生成できます。リアルで映画のようなスタイルから、独創的なアニメーションまで、様々なアートスタイルに対応する高い表現力を備えています。

Prompt: in the style of a japanese anime, a jubilant scene under a limitless bright sky brimming with clouds and sparkling stars…

映像と完全に同期した音声

映像の内容に合わせて、リアルな効果音、背景音、さらには登場人物の会話まで自動で生成します。雪山で叫ぶ声や水中の環境音など、映像と音声が完全に同期した、没入感のあるコンテンツを作成する能力があります。

Prompt: Title — Lanterns Above, Distance Between (10.0s, Live Action Black & White / Festival Night)…

現実の人物やモノをビデオに登場させる

Sora 2の画期的な機能の一つが、現実世界の要素をビデオ内に取り込む能力です。あなた自身や友人、ペットなどを撮影した短い動画をアップロードするだけで、その外見や声をSora 2が学習。生成する全く新しいビデオの中に、まるで元からいたかのように自然に登場させることができます。この機能は人だけでなく、あらゆる動物や物体にも適用可能です。

Prompt: Bigfoot is really kind to him, a little too kind, like oddly kind. Bigfoot wants to hang out but he he wants to hang too much

責任あるローンチ

OpenAIは、ドゥームスクローリング、依存症、孤立、そしてRL(強化学習)に最適化されたフィードに関する懸念を最優先に考え、以下の対策を講じています。

  • フィードの制御: ユーザーがフィードで何を見るかをコントロールできるツールと選択肢を提供します。
  • 友人との利用促進: このアプリは友人と一緒に使うために作られています。テスターからは、カメオ機能がこれまでにない楽しさを生み出すとのフィードバックが多数寄せられています。
  • ティーンの保護: ティーンエイジャーのウェルビーイング保護は重要です。1日に閲覧できる生成コンテンツの数にデフォルトで制限を設け、カメオ機能にもより厳しい権限設定が導入されます。
  • 自分の容姿の管理: カメオ機能では、自分の容姿を誰が使用できるかを完全に自分で決定でき、いつでもアクセスを取り消したり、関連動画を削除したりできます。

このアプリに関する安全性への取り組みの詳細については、Sora 2の安全性に関する文書をご覧ください。

Sora 2 搭載iOSアプリがリリース

Sora 2を搭載した新しいソーシャルiOSアプリ「Sora」がリリースされました。

Soraは、音声と同期した短いビデオを作成するための新しいOpenAIアプリです。次世代モデルであるSora 2を搭載しており、リアリズム、物理演算、指示追従性が向上しています。このアプリは、手軽で協力的な創造活動のために設計されており、テキストや写真から何かを作成したり、気に入ったものをリミックスしたり、友人と共有したりできます。

作成できるもの

Soraは、リアルで指示に忠実な短いクリップの作成に最適で、以下のことができます:

  • シーンを記述する:音声と同期した10秒の縦型ビデオ(デフォルト9:16)を生成。
  • 画像から始める:静止画をアニメーション化。
  • リミックスする:既存の投稿をリミックスして、リミックスであることを明記した上で独自の作品を作成します。

現在、実在の人物が写っている画像からの動画生成はサポートされていませんのでご注意ください。

ビデオを作成するには、Soraアプリを開いて + をタップします。新規にビデオを記述するか、画像をアップロードするかを選択します。

Sora 2は間違いを犯す可能性があることにご注意ください。一度に多くの人が話すシーン、複雑な衝突、非常に速いカメラの動きには苦労することがあります。間違いを見つけた場合は、より短いプロンプト、単純な動き、少ないキャラクター、またはより明確なカメラ指示を試してください。

Soraのカメオ機能について

Soraアプリには、カメオ(Cameos)と呼ばれる機能が搭載されています。

カメオ機能を使えば、自分自身(または承認した友人)をビデオのキャラクターとして登場させることができます。

カメオの設定はオプトイン式で、Soraがあ自分を正確に表現し、不正利用を防ぐための簡単なビデオ・音声認証が含まれます。誰があなたのカメオを使用できるかを個人ごとに管理し、いつでもアクセスを取り消すことができます。また、他人が作成した下書きを含め、自分のカメオが含まれるビデオを削除することもできます。

ローンチ時点で、実在の人物が写っている画像からの動画生成はサポートされていないようなのでご注意ください。

Soraアプリの利用に関する詳細

提供地域

提供はまず米国とカナダから始まり、その後他の国々へも拡大される予定です。ローンチ時点では、英国、EU、オーストラリアは提供対象地域に含まれていません。

モデルのバージョンと主な機能

提供されるモデルには、速度と日常的な創作に合わせて調整された「Sora 2」と、より高い忠実度を目指す「Sora 2 Pro」があります。

「Sora 2 Pro」は、より複雑なショットを対象としており、将来的にはChatGPT ProユーザーやAPIを通じて提供される予定です。Soraは映像だけでなく、プロンプトでの指示に基づき、セリフや環境音を含む音声を映像と同時に生成できます。

プライバシーとコンテンツの信頼性

ユーザーのプライバシー保護は重要視されており、特に自身の姿をビデオに登場させる「カメオ」機能は、オプトイン(事前同意)が必須です。ユーザーは誰が自分の肖像を使用できるかを個別に許可でき、いつでもその許可を取り消すことが可能です。また、生成されたすべてのビデオには、コンテンツの出所を明確にするため、可視の動くウォーターマークと、改ざん防止のための業界標準技術「C2PAメタデータ」が埋め込まれます。

Sora 1の今後について

従来の「Sora 1 Turbo」も引き続き利用可能です。Sora 1で作成した作品は、引き続き「sora.com」のライブラリに保存されます。将来的に提供が終了する際には、事前に告知が行われる予定です。

Sora 2の利用と今後の展望

Sora 2は、新しいSoraアプリで体験できます。

ローンチ時点では、iOSアプリと、より高度な制御が可能なウェブサイト版「sora.com」で利用可能となり、Android版は後日対応予定です。

Soraは既存のOpenAIアカウントで利用できます。ChatGPTで使用しているのと同じ認証情報でサインインしてください。アプリ内でサインアップすると、アカウントへのアクセスが可能になった際にプッシュ通知が届きます。初期展開は米国とカナダで開始され、速やかに他の国にも拡大予定です。

招待を受けた後、sora.comからもSora 2にアクセスできるようになります。

Sora 2は当初無料で提供され、計算資源の制約はありますが、その能力を自由に探求できるよう十分な利用制限が設けられます。

ChatGPT Proユーザーは、sora.comで実験的な高品質モデル「Sora 2 Pro」も利用できるようになります。将来的にはAPIでの提供も計画されています。


動画モデルは急速に進歩しています。汎用的なワールドシミュレーターとロボットエージェントは、社会を根本的に変革し、人類の進歩の弧を加速させるでしょう。Sora 2は、その目標に向けた重要な進歩です。OpenAIの使命に沿って、これらのモデルが開発されるにつれて人類がその恩恵を受けることが重要です。Soraが世界に多くの喜び、創造性、そしてつながりをもたらすことを信じています。

— Soraチームより

OpenAI Sora ウェブサイトへ

コメント

Translate »
タイトルとURLをコピーしました