見出し画像

映像クリエーターのための「Nano Banana Pro」/もうNano Banana Proしか使っていない! - Blog 2025/12/19

現在、画像生成AIモデルは「Nano Banana Pro」一択になっており、他の画像生成AIモデルはほとんど使用していません。
※旧モデルのNano Bananaも使用していません。

Nano Banana Proの検証結果が出揃ってきましたので、いくつかピックアップしておきたいと思います。


Nano Banana ProでAIドラマ制作

Nano Banana Pro(正式名称:Gemini 3 Pro Image)は、従来の画像生成AIとは一線を画す「論理的思考(推論)」能力を備えたモデルであり、ドラマ制作のような一貫性が求められるタスクにおいて劇的な進化を遂げています。

特に「Gemini 3」の推論能力がプロンプトの意図を深く汲み取り、最大14枚の参照画像を使ってキャラクターを固定できる点が最大の武器です。

Gemini 3の推論力を活かした「演出プロンプト」

Gemini 3は言葉の裏にある「文脈」を理解します。単なる「走っている男」ではなく、ドラマのト書きのような指示が通じます。

  • カメラワークの指定:

    • Cinematic lighting(映画のような照明)、Low angle(ローアングル)、Depth of field(被写界深度)といった撮影用語を正確に反映します。

    • コツ: 「緊迫感を出すために、カメラを斜めにして(Dutch angle)」といった、感情と結びついた演出指示をプロンプトに加えると、AIがその意図を汲んで構図を決定してくれます。

以下の「ひかりの天然無双」では、映画的指示を駆使しています。

  • 再生時間:58秒
    YouTubeショート動画

人物一貫性を資産化

キャラ資産(1人あたり推奨セット)

  • 正面・半身・横顔・表情差分(微笑/緊張/怒り)など、角度と表情が違う3〜6枚

  • 識別点を固定:髪型の分け目、ほくろ、眉の形、耳の形、眼鏡のフレーム等

重要なコツ

  • 参照画像は「似ている画像を増やす」より、役割が異なる画像を揃える(角度・表情・距離)ほうが、ドラマ制作では効きます(同一人物を別ショットで使うため)。

  • 逆に、参照同士が矛盾(髪色が違う、年齢感が違う、化粧が極端に違う等)すると、モデルは平均化(別人化)しやすいので避けます。


複数人シーンの制御

複数のキャラクターを一貫性を保って登場させることも可能です。Nano Banana Proは最大5人のキャラクターの一貫性を同時に処理できるとされています。
※COLORSプロジェクトの検証では、4人で安定、5人以上はリファレンスの繰り返しで対応することで成功率を高めています。
例:まず3人をリミックス、その後、2人を追加してリミックス(5人登場するシーンが安定的に生成できる)

  • コツ:

    • Aさん、Bさんそれぞれのマスター画像を用意し、プロンプトで「[画像1]の男性が右側で叫び、[画像2]の女性が左側で銃を構えている」といったように、参照元を明確に紐づけた指示を出します。Gemini 3が「誰が何をしているか」を論理的に整理して配置してくれます。

Google検索(Grounding)によるリアリティ付与

Nano Banana ProはGoogle検索と連携できます。

  • 活用法: 例えば「現代のニューヨークの路地裏」というシーンを作りたい時、Google検索の最新情報を基に、現在のトレンドや看板の雰囲気などを反映させることが可能です。


プロンプトを「固定情報」と「可変情報」に分離する

ドラマ制作では毎回プロンプトを一から書くより、テンプレに差分だけ入れるほうが安定します。Nano Banana Proは推論を使って複雑な指示を処理する設計(Thinking/思考プロセス)も明示されているため、テンプレ運用と相性が良いです。

テンプレ設計

  1. 固定(不変):人物の同一性条件(顔・髪・体型・年齢帯・特徴点)、作品のルック(レンズ/色/照明/粒状感)

  2. 準固定(エピソード内で固定):衣装カテゴリ(FBIジャケット/私服など)、小物(バッジ/スマホ/銃/車種)

  3. 可変(ショットごと):場所、時間帯、アクション、カメラ、感情、背景演出


「ひかりの天然無双」は、Nano Banana Proの技法の試行場所となっています。映像コンテンツの中には技術の解説はありませんが、最新テクニックのサンプル映像として確認できます。
詳しい解説は、報告会などで行なっています。


Nano Banana Proで高品質化

Nano Banana Proで以下のプロンプトが劇的な効果を発揮する理由は、従来の画像生成AIとは根本的に異なる映像生成アーキテクチャと言語理解能力の融合にあります。

高品質化プロンプト(Nano Banana Pro専用):

Quality & Style Modifiers: Hyper-realistic, 8k resolution, UHD, RAW photo, shot on 70mm, detailed skin texture, visible pores, subsurface scattering, cinematic lighting, volumetric lighting, depth of field, sharp focus, bokeh background, masterpiece, photorealistic.

当然ですが、これは「アップスケール」ではありません。

生成モデルが、それらしく見える高周波ディテール(毛穴・微細なシワ・フィルムグレイン・微小なエッジ強調など)を新規に合成して「解像感」(※解像度ではない)を上げていることによって起きます。
いわば擬似ディテール付与です。

以下の「ひかりの天然無双」では、同プロンプトを実行して見た目の品質を大幅に向上させています。

  • 再生時間:56秒
    YouTubeショート動画

キーワードではなく、物理現象として理解している

Nano Banana Proは、上記のプロンプトの言葉を物理的な光の挙動として理解しています。

  • Subsurface scattering:
    「光が皮膚を透過し、内部で散乱して赤みを帯びて出てくる現象」として計算する。

  • Visible pores:
    「肌のノイズ」ではなく、「毛穴という微細な凹凸構造」として認識する。

  • Shot on 70mm:
    「古い写真風」ではなく、「70mmフィルム特有の粒状感(グレイン)とダイナミックレンジの広さ」として再現する。

このような「意味の深い理解」があるため、物理的に正しいディテールが描き込まれます。

上記のプロンプトにある「detailed skin texture」や「visible pores」は、低解像度のキャンバスでは描写不可能です(1ピクセル以下になってしまうため)。
Nano Banana Proはキャンバスが広大(ピクセル数が多い)なため、毛穴や産毛の1本1本を独立したオブジェクトとして描画する余裕があります。
これが「擬似的なアップスケール」のように見える理由です。

再現性を上げる実務的なコツ
(※Nano Banana Pro専用)

  1. 「8k」は目標表現として残しつつ、解像度は現実値で指定
     例:「4K output」など、モデルが到達可能な範囲に寄せる(最大4Kは公式仕様)。

  2. 肌は「自然さ」のガードレールを追加
     「natural skin microtexture, subtle pores, no plastic/waxy skin, no over-sharpening」

  3. 撮影設定を少数精鋭に
    (70mmよりも、焦点距離+絞りの方が制御しやすいことが多い)
     例:「85mm lens, f/1.8, shallow depth of field」

この特性を活かすと、さらに面白い表現が可能です。
人物等の画像に対して、あえて逆の「劣化表現」を物理的にシミュレーションさせます。

例えば、

  • Chromatic aberration (色収差)

  • Motion blur (被写体ブレ)

  • ISO noise 3200 (高感度ノイズ)

これらを意図的に加えることで、Nano Banana Proの「物理理解」の高さが逆説的に証明され、実写と見分けがつかないリアリティが出ることがあります。

繰り返しになりますが、他の画像生成AIモデルでは役に立ちません。
Nano Banana Proのテクニックです。


詳しくは明日の報告会で解説したいと思います。


更新日:2025年12月19日(金)/公開日:2025年12月19日(金)

いいなと思ったら応援しよう!