見出し画像

さて。どうする... Nano Banana Pro

来週の報告会の資料を全て作り直している。
ステージが完全に変わってしまったからだ。


画像生成AIモデルは「猫を描いて」と指示されると、過去の膨大な猫の画像データから「猫っぽい形」を確率的に予測して描き始める。
「なぜそこに猫がいるのか」「重力はどうなっているか」といった理屈は考えていない。だからデタラメな骨格やあり得ないポーズが生成される。

Nano Banana Proの場合、「猫を描いて」と言われたら、まず「思考(Thinking)」する。「どんな猫?背景が日本家屋なら、猫は畳の上に座らせよう。光は障子越しだから柔らかくなるはずだ」と論理的に計画してから、絵を生成し始める。

Nano Banana Proの凄さは、画像生成エンジンの性能だけではなく、司令塔である「Gemini 3 Pro」という超巨大な言語モデル(LLM)の推論能力に依存していること。

Nano Banana Proは、AI画像生成における重要なマイルストーンであり、あらゆる分野のクリエーターにマインドセットを迫る意識改革の始まりだと言える。

Firefly (Gemini 3 - Nano Banana Pro)
これだけのリファレンスを扱えるのはNano Banana Proだけ
6つの画像をリミックス

従来の価値:

  • 「美しい画像を作成できる」← AIに代替される

  • 「短時間で仕上げられる」← AIの方が速い

これからの価値:

  • なぜその表現が必要かを説明できる

  • 文化的・歴史的文脈を理解している

  • 複数の表現手法を統合的に設計できる

  • 抽象的な概念を具体的なビジュアルに翻訳できる

  • 物語全体の整合性を保てる

これだけの構成要素をコントロールできるようになった

指示の深度:

Nano Banana Proの能力を引き出せるのは、深い指示である。
つまり、使う人間側に専門の知識が必要。

  • 浅い:
    「かっこいい感じで」

  • 深い:
    「1920年代アール・デコ様式の幾何学的パターンを基調に、クライムトの金箔技法を現代的に解釈して」


知識とは、AIに対する「共通言語のボキャブラリー」。
自分の中に「引き出し」がなければ、AIという無限の図書館から、特定の1冊を引き出すための検索ワードすら思いつかない。
「知らないものは頼めない」。

Nano Banana Proのような高性能なAIモデルほど、人間側に知識が必要になる。
いくらプロンプトの書き方を学んでも、専門知識がないと有効なプロンプトを書くことができないからだ。

  • 映画・小説・写真・アートのストックがあるほど、
     参照できる「構図・構成・テンポ・語り口」の引き出しが増える

  • 歴史・社会・科学・宗教・哲学などの知識があるほど、
     「物語の意味」や「テーマの厚み」を設計できる

  • クライアントビジネスやマーケティングへの理解があるほど、
     「売れるストーリー」「機能するストーリー」を構築できる


最適化されたプロンプトを書けるかどうかをテストするツールとしてお奨めできるのが「Sora アプリ」である。
動画生成AIモデルの中で、Sora 2 Proは最も高性能で、Google VeoやKLINGでも追いついていないので、指示の深度を測るには最高のツールだと言える。

私のSoraアプリは「(擬似)昭和製造機」になっている


更新日:2025年11月21日(金)/公開日:2025年11月21日(金)

いいなと思ったら応援しよう!