2025年5月20日(現地時間)- Google は、毎年恒例の開発者向けカンファレンスである Google I/O 2025 にて新しい生成メディアモデルとツールを発表しました。
Veo 3: 動画と音声の融合
新しい最先端の動画生成モデルであるVeo 3は、Veo 2の品質を向上させただけでなく、初めて音声付きの動画を生成できるようになりました。
街中のシーンでの交通騒音、公園での鳥のさえずり、さらにはキャラクター間の会話までも生成可能です。
Veo 3は、テキストや画像からのプロンプト入力、現実世界の物理法則の理解、正確なリップシンクなど、あらゆる面で優れています。プロンプトで短い物語を伝えるだけで、それを生き生きと表現するクリップを生成します。
Veo 3は、米国内のUltraサブスクライバー向けにGeminiアプリとFlowで本日より利用可能です。また、エンタープライズユーザーはVertex AIで利用できます。
Veo 2 アップデート: 映画制作者と共に、映画制作者のために
Veo 3の開発を進める一方で、人気のVeo 2モデルにも、クリエイターや映画制作者との協力から生まれた新機能が追加されました。
本日リリースされた主な新機能は以下の通りです。
参照ベースの動画生成: キャラクター、シーン、オブジェクト、さらにはスタイルを指定した画像をVeoに与えることで、より優れたクリエイティブコントロールと一貫性を実現します。
カメラコントロール: 回転、ドリー、ズームなど、正確なカメラの動きを定義し、完璧なショットを実現します。
アウトペインティング: フレームを広げ、動画を縦向きから横向きに変更したり、あらゆる画面サイズに合わせやすくしたりすることができ、シーンにインテリジェントに追加します。
オブジェクトの追加と削除: 動画からオブジェクトを追加または削除できます。Veoはスケール、相互作用、影を理解し、自然でリアルなシーンを作成します。
参照ベースの動画生成とカメラコントロールは、現在 Flowで利用可能です。
これらの新機能は、今後数週間以内にVertex AI APIに、そして今後数ヶ月以内にさらに多くの製品に搭載される予定です。
Flow: Veoのために設計されたAI映画制作ツール
クリエイターと共に、クリエイターのために作られたFlowは、Google DeepMindの最先端モデルであるVeo、Imagen、Geminiを統合し、映画のようなクリップ、シーン、ストーリーをシームレスに作成できるAI映画制作ツールです。
昨年リリースされたGoogle Labsの実験的機能であるVideoFXの進化形とされおり、『Flow』という名前は、時の流れがゆっくりと進み、創造が自然で反復的、そして可能性に満ち溢れている時の感覚からインスピレーションを得ているとのことです。
自然言語でショットを記述し、キャスト、場所、オブジェクト、スタイルといったストーリーの要素を一箇所で管理し、Flowを使って物語を美しいシーンに織り上げることができます。
Flowの主な機能
Flowは、Googleの最先端の生成動画モデルであるVeoのために特別に設計されており、プロンプトへの忠実性が非常に高く、物理法則や現実感に優れた映画品質の映像を生み出すことができます。
その裏側では、Geminiモデルがプロンプト入力を直感的なものにし、あなたのビジョンを日常的な言葉で表現することを可能にします。
キャラクター作成には、お手持ちのアセットを使用することも、Flow内でImagenのテキストから画像を生成する機能を使って独自の素材を作成することもできます。
一度、被写体やシーンを作成すれば、それらの素材を一貫性を保ちながら、さまざまなクリップやシーンに統合していくことができます。また、既存のシーンの画像を基にして、新しいショットを開始することも可能です。
- カメラコントロール: カメラの動き、アングル、視点を直接操作し、思い通りのショットを撮影できます。
- シーンビルダー: 既存のショットをシームレスに編集・拡張できます。アクションをさらに見せたり、連続的な動きと一貫したキャラクターを保ったまま次のシーンへと自然に移行したりすることが可能です。
- アセット管理: 作成した素材やプロンプトを簡単に管理・整理できます。
- Flow TV: Veoで生成されたクリップ、チャンネル、コンテンツが続々と追加されるショーケースで、あなたの創造性を刺激します。気に入ったクリップで実際に使用されたプロンプトやテクニックを確認できるため、新しいスタイルを学び、取り入れるための実践的な手段となります。
映画製作者とのコラボ作例
Googleが映画制作者にFlowの早期アクセスを提供し、以下のようなFlowと他のツールやテクニックを用いた短編映画が製作されています。
Flowは、米国内のGoogle AI ProおよびUltraプランのサブスクライバー向けに本日より利用可能で、対応国は順次拡大予定です。
Google AI Pro では、主要な Flow 機能と 1 か月あたり 100 世代が提供されます。
Google AI Ultra では、最高の使用制限とネイティブ オーディオ生成を備えた Veo 3 への早期アクセスが提供され、環境音やキャラクターのダイアログをビデオ作成に直接取り入れることができます。
Imagen 4: 驚異的な品質と優れたタイポグラフィ
最新のImagenモデルであるImagen 4は、スピードと精度を兼ね備え、より高品質の画像を生成するようになりました。
複雑な布地、水滴、動物の毛皮などの細部の鮮明さに優れ、写実的なスタイルと抽象的なスタイルの両方で卓越した性能を発揮します。
Imagen 4は、さまざまなアスペクト比で最大2K解像度の画像を生成でき、印刷やプレゼンテーションにも最適です。また、スペルやタイポグラフィの精度も大幅に向上し、オリジナルのグリーティングカード、ポスター、さらにはコミックの作成も容易になります。



Imagen 4は、本日よりGeminiアプリ、Whisk、Vertex AI、そしてWorkspace内のSlides、Vids、Docsなどで利用可能です。
さらに、近日中に、Imagen 3よりも最大10倍高速なImagen 4の高速バージョンもリリース予定です。
Lyria 2: パワフルな作曲と無限の探求
4月には、Lyria 2 を活用した「Music AI Sandbox」へのアクセスが拡大され、より多くのクリエイターが利用できるようになりました。
この「Music AI Sandbox」は、ミュージシャン、プロデューサー、ソングライターの方々に向けて、実験的な作曲ツール群を提供するものです。これを使うことで、新しい音楽表現のアイデアが生まれたり、ユニークな楽曲作りに挑戦したりと、創造性をさらに広げることができます。
Googleは、音楽業界の専門家やクリエイターから寄せられる貴重な意見を参考に、AIを音楽制作に活かすことで生まれる新しい可能性を追求し、クリエイターの皆様の活動を力強くサポートできるようなツールの開発をしているとのことです。
Lyria 2は、現在、YouTube Shortsを通じてクリエイター向けに、またVertex AIでエンタープライズ向けに利用可能です。また、 MusicFX DJを強化するインタラクティブな音楽生成モデルであるLyria RealTimeも、API経由およびAI Studioで利用可能になりました。Lyria RealTime を使えば、誰もがリアルタイムで生成音楽をインタラクティブに作成、制御、演奏できます。
責任ある創造とクリエイティブコミュニティとの連携
2023年の開始以来、SynthIDは100億以上の画像、動画、音声ファイル、テキストに電子透かしを施し、AIによって生成されたことを識別し、誤情報や誤った帰属表示の可能性を減らすのに役立っています。
Veo 3、Imagen 4、Lyria 2によって生成された出力には、引き続きSynthIDの電子透かしが入ります。
さらに、本日、AI生成コンテンツの識別を支援する検証ポータルSynthID Detectorがリリースされました。コンテンツをアップロードすると、SynthID Detectorはファイル全体または一部にSynthIDが含まれているかどうかを識別します。
Fuel your creativity with new generative media models and tools























コメント