Googleが「Nano Banana 2」を公開!高品質と高速処理を両立する次世代モデルが登場

CGソフト

2026年2月26日(現地時間)- Google DeepMindは、最新の画像生成AIモデル「Nano Banana 2」を発表しました。

Nano Banana 2 概要

Googleの画像生成モデル「Nano Banana」は昨年8月にリリースされて以降、画像生成と編集の分野で大きな注目を集めました。続いて11月には、より高度な知能とスタジオ品質のクリエイティブコントロールを提供する「Nano Banana Pro」が公開されています。

今回発表された「Nano Banana 2(Gemini 3.1 Flash Image)」は、これら両モデルの強みである「品質」と「速度」を兼ね備えており、高度な知識や推論能力を備えた既存の上位モデルの機能性と、高速な処理速度を両立させたGoogleの最新の画像生成AIモデルとなっています。発表後、このモデルは幅広いGoogle製品向けに提供が開始されています。

テキストからの画像生成におけるベンチマーク比較

以下では、主な特徴や提供情報を紹介したいと思います。

インテリジェンスと視覚的品質を落とさずに高速処理を維持

Nano Banana 2 は、Gemini Flash の高速処理能力を画像生成システムに取り入れることで、品質を落とさずに高速な画像編集や反復作業(イテレーション)が可能になりました。これまで Pro 版でしか使えなかった機能が、より幅広いユーザー環境で利用できるようになっています。

高度な世界知識(グラウンディング)

Gemini が持つ現実世界の知識ベースに加え、ウェブ検索からのリアルタイム情報や画像データも参照することで、特定の被写体をより正確にレンダリングできるようになりました。この深い理解力により、単なるイラスト生成にとどまらず、インフォグラフィックの作成、テキストメモから図表への変換、データの視覚化といった用途にも対応します。

このビジュアル・グラウンディングのデモンストレーションとして開発されたのが「Window Seat」です。これは、Nano Banana 2の知識とウェブ画像検索を利用して、実在の場所や現地のリアルタイムの天気データに触発されたフォトリアルな「窓からの景色」を生成するアプリとなっています。

デモアプリ「Window Seat」。世界の様々な場所と天候に基づいたフォトリアルな景色を生成

正確なテキストレンダリングと翻訳

ダイナミックなUI生成やクリエイティブツールを作るうえでは、くっきり読める正確なテキストが欠かせません。Nano Banana 2 では、画像の中に読みやすく整った文字を生成する精度が大きく向上しています。

さらに、画像内のテキストを指定した言語へ翻訳してローカライズすることも可能になりました。デモアプリ「Global Ad Localizer」では、広告の文言を多言語に翻訳するだけでなく、文化や文脈に合わせてビジュアル自体も最適化する様子が確認できます。単なる文字の置き換えにとどまらず、現地向けに広告全体を理解して調整できる点が特徴です。

デモアプリ「Global Ad Localizer」。広告のテキストとビジュアルを各国の言語と文化に合わせて自動変換

高度なコントロール機能を搭載

Nano Banana 2は、生成スピードを向上させながらも、高品質でフォトリアルな画像の出力を実現しています。特にCGクリエイターやデザイナーのワークフローで役に立つ、以下の機能強化が行われています。

被写体の一貫性(Subject consistency)

単一の生成ワークフロー内で、最大5人のキャラクターの容姿や、最大14個のオブジェクトのディテールを一貫して保持することができます。これにより、プロンプトを変更してもキャラクターの外見が変わってしまうことを防ぎ、連続したストーリーボードやコンセプトアートの制作がよりしやすくなります。

「被写体の一貫性」機能により、14のキャラクターやアイテムのデザインを保持したまま生成した作例

デモアプリ「Pet Passport」では、1 枚のペット写真をもとに、世界中のランドマークを旅するペットの姿を生成できます。背景や環境がどれだけ変わっても、ペットの外見は常に正確に保たれ、毛並みや模様、顔の特徴などが崩れません。被写体の一貫性が実際の制作でどのように役立つかを直感的に理解できる例となっています。

複雑なプロンプトへの正確な追従

ユーザーからの指示に対する理解力が向上しており、多層的な要件を含む複雑なリクエストであっても、指定されたニュアンスをより厳密に捉えて画像を生成することができます。

細かな指示に従い、様々な表情やアングルでツリーハウス作りを描いたストーリーボードの生成例

様々な解像度と比率に対応

様々なプロジェクト要件に合わせて柔軟に画像を生成・編集できます。既存のすべてのアスペクト比に加えて、新たに4:1、1:4、8:1、1:8のネイティブアスペクト比がサポートされました。

また、効率化を最適化するため、1K、2K、4Kの解像度に加えて、新たに512pxの解像度が追加されました。これにより、ラピッドプロトタイピングや負荷の高い生成パイプラインにおけるレイテンシを最小限に抑えることができます。

視覚的品質のアップグレード

Flashと同等の生成速度を維持しながら、鮮やかで自然なライティング、より豊かなマテリアルテクスチャ、そしてシャープなディテール表現を実現しています。

各Googleプラットフォームでの展開

「Nano Banana 2」モデルは、以下のGoogle製品およびAPIで順次利用可能となります。

  • Geminiアプリ: Fast、Thinking、Proの各モデルにおいて、画像生成機能がNano Banana ProからNano Banana 2へと置き換わります。Google AI ProおよびUltraのサブスクライバーは、メニューから画像を再生成することで、引き続き特化タスク用にNano Banana Proを利用できます。(公式ドキュメントへ)
  • Google検索: AI ModeおよびGoogle Lensにて、モバイルアプリとブラウザの両方で利用可能です。新たに141の国と地域、8つの言語が追加されました(詳細な対応状況はこちら)。
  • AI StudioとGemini API: 開発者向けにAI StudioおよびGemini APIでプレビュー版として提供されます(料金情報)。また、Google AntigravityFirebaseでも利用できます。(実装の詳細は公式Cookbookもご参照ください)
  • Google Cloud: エンタープライズ向けとして、Vertex AIのGemini APIを通じてプレビュー利用が可能です。
  • Google Flow: Flowにおけるデフォルトの画像生成モデルとなり、すべてのFlowユーザーがクレジット消費なしで利用できます。
  • Google広告: キャンペーン作成時の画像サジェスト機能の裏側として既に稼働しています。
Geminiアプリに導入された新しいテンプレート機能を利用したNano Banana 2の生成UI

ComfyUIでの利用について

オープンソースのノードベース画像生成UI「ComfyUI」においても、Partner Nodesを通じてNano Banana 2が利用可能になりました。ComfyCloud上ですぐにテストすることも可能です。

ComfyUI 環境では、生成プロセスにおける思考レベル(Thinking levels)を細かく調整できる点が大きな特徴になっています。アイデアを素早く試したい段階では「Minimal」を選ぶことで軽快に生成を回せる一方、複雑な構図や多人数シーン、細かな指示を含むプロンプトを扱う際には「High」や「Dynamic」に切り替えることで、より深い理解と高い精度での生成が可能になります。

こうした切り替えによって、スピード重視の探索フェーズと品質重視の仕上げフェーズを柔軟に行き来でき、イテレーションとクオリティコントロールを両立したワークフローを実現しています。

ComfyUIでのNano Banana 2ノード利用イメージ。解像度やアスペクト比に加え、推論深度のコントロールが可能

ComfyUIでの導入・スムーズな移行方法

ComfyUIを最新版にアップデートし、キャンバス上で「Nano Banana 2」ノードを検索して追加するか、公式のテンプレートライブラリからワークフローを読み込むだけで利用できます。

また、既存の「Nano Banana Pro」ノードにも新モデルのバージョンが追加されているため、過去に作成したワークフローを作り直すことなく、プルダウンでバージョンを切り替えるだけでそのまま活用できます。

モデルの選び方(Nano Banana Proとの使い分け)

極めて厳密な事実の正確性が求められるケースや、失敗が許されない重要なエッジケースを扱う場合には、引き続き Nano Banana Pro が最適です。

一方で、Nano Banana 2 は高速な生成と実用レベルの高品質な出力を両立しており、多くのクリエイターにとっては日常的に使う“新しい標準モデル”として十分な性能を備えています。

制作のスピードと品質のバランスを重視するワークフローでは、Nano Banana 2 が自然な第一選択肢になります。

AI生成コンテンツの出どころ証明と検証機能

生成AI技術の進化に伴い、生成されたメディアを正しく識別するためのツールも重要性を増しています。Googleは、独自の電子透かし技術である「SynthID」と、標準規格である「C2PA Content Credentials」を組み合わせることで、画像がAIで生成されたかどうかだけでなく、どのように生成・編集されたかというコンテキスト(文脈)を提供するアプローチを進めています。

昨年11月のリリース以来、Geminiアプリに搭載されたSynthID検証機能は既に様々な言語で2,000万回以上利用され、ユーザーによるAI生成画像・動画・音声の識別に貢献しています。今後はGeminiアプリにもC2PA検証機能が導入される予定です。


Nano Banana 2: Combining Pro capabilities with lightning-fast speed

Build with Nano Banana 2, our best image generation and editing model

コメント

Translate »
タイトルとURLをコピーしました