誰でも自由に生成できるのは今だけか?/Photoshopで使うNano Banana Proが一番エキサイティング! - Diary 2025/12/8
GenAI Diary
この日記は「自分用のメモ」であり、SNSの代替
公式のライブ配信がある日は更新されない
PCを使っていると「ですます調」、スマホで書いていると「である調」になりやすい
2025年12月8日(月)
2025年は、残り24日。
あと、24日で大晦日である。
生成AIサービスの断捨離の時期なので、使用頻度の低いサービスは解約されてしまう。各社、太っ腹のキャンペーンはまだ続く。
ChatGPTのProプランは月額200ドルなので、年内もう1つ何かが来るはず。
コンテキスト・エンジニアリング
企業研修の教育設計において、生成AIカテゴリーでは「プロンプトエンジニアリング」が減少し、「コンテキスト・エンジニアリング」の講座が急増中。
プロンプトエンジニアリングはコンテキスト・エンジニアリングのサブセットという扱いに変わっている。
AIがタスクを解決するために必要なあらゆる情報(コンテキスト)全体を戦略的に設計・管理する新しいアプローチである。
より複雑で自律的なエージェント型アプリケーションが台頭するにつれ、業界全体がプロンプトエンジニアリングの限界に直面している。
モデルの賢さが向上しても、与えるコンテキストの質が低ければ、その潜在能力を活かせない。
モデル中心の最適化からコンテキスト中心のアーキテクチャへとシフトしており、これが現代のAIシステム設計における主要な差別化要因となっているようだ。
8つのプラットフォームでNano Bananaを使う
現在、最も使用頻度の高い生成AIは「Nano Banana Pro (Gemini 3)」である。Adobe FireflyやFreepik、Leonardo AI、Envato、DzineAI、DomoAI等々、様々なプラットフォームでNano Banana Proを使う。
Photoshopで使うNano Banana Proが一番エキサイティングだ。
今まで蓄積してきたPhotoshopのスキルを活かせるので、意図した通りのビジュアルへと追い込むことができる。
特に、ビジュアルプロンプティングでは大変役立つ。


Nano Banana Proは(今のところ)10クレジットしか消費しないので気軽に使える。
ちなみに、Adobe Fireflyの方はまだ「無制限」だ。
無制限キャンペーンは15日終了する。
Adobe Fireflyの無制限キャンペーンが延長
全ての画像生成AIモデルとFirefly Videoの無制限キャンペーンが延長された。今まで12月1日に終了と予告されていたが、現在は「15日に終了」と記載されている。


権利者側から見れば、生成AI向けライセンスは新たな収益源
SunoAIとワーナー・ミュージック・グループ(WMG)が著作権訴訟を和解し、2026年からライセンス型の新モデルに移行することは、単なる一企業同士の合意というより、生成AIとコンテンツ産業全体の「フェーズの切り替わり」を象徴する出来事だと考えられる。
現行モデルは段階的に廃止され、新しい枠組みでは、無料ユーザーは再生とSuno内での共有が中心となり、有料ユーザーのみが制限付きでダウンロードできる方向が示されている。
同時に、WMGアーティストが自分の声や楽曲をAIに使わせるかどうかを選択できる仕組みや、AIカバーなどをブロックする技術的なガードレールも導入されていくようだ。
無許可で膨大な音源を学習に使ってきたAI企業に対して、権利者が本格的な訴訟やロビー活動を通じて強くプレッシャーをかけている状況があり、AI側にとって「クローリングして学習する」ビジネスモデルは法的にもレピュテーション的にも持続しにくくなっている。
権利者側から見れば、AI向けライセンスは新たな収益源であり、「AI時代の二次利用ビジネス」として期待値が高まっている。
両者の折衷点として、「ライセンス料を払う代わりに、権利クリアなAIモデルを提供する」という方向が、音楽を皮切りに一気に立ち上がっていると予想できる。
自由に生成できるのは今だけか?
個人クリエイターの視点では、「失われるもの」と「残るもの」、「強化されるもの」が混在する。
今後「失われるもの」としては、無制限に近い大量生成と、それを前提にした「とにかく数を出し、その中から選ぶ」やり方、そして著名なアーティストのスタイルを素材として扱う即物的な模倣の自由などがある。
また、プラットフォーム内での閉じた仕様が増えると、生成物を他のAIや制作パイプラインの学習素材として再利用する自由も制限される。
その一方で、権利面を気にせず商用利用できる「クリーンな」パイプラインは、ライセンス型モデルの整備によってむしろ安定していく。
自分自身のIPやオリジナルキャラクター、世界観を核にした表現は、他者のIPに依存しないぶん自由度が高く、将来的には自分のIPをAI向けライセンス資産として提供する側に回る可能性も出てくる。
長期的に見ると、いま起きていることは、「誰でも自由に大量生成できるワイルドウェスト期」が終わり、「IPとライセンスを前提に整理された“プロの生成エコシステム”」と「自由だが法的リスクを抱えたオープン/地下エコシステム」が並存する世界への移行、と位置づけることができそうだ。
KLING AI 大型アップデート
O1
最新のマルチモーダルモデル「O1」については以下。

v2.6
「v2.6」はネイティブオーディオを実現した動画生成の最新モデル。
ただ、対応言語が英語と中国語なので、今のところ検証は後回し。
マルチモーダルモデル「O1」の方を優先して検証中。

Avatar 2.0
アバター機能のアップデート。
かなり良くなっているが、このジャンルは強豪が多く、高性能なアバター機能に慣れてしまったので、あまり驚きはない。



Runway Gen-4.5
Runwayの最新モデル「Gen-4.5」。あと少々で利用可能になる。
使えるようになったら検証開始する。
カジュアルにElevenLabsで声を生成
映像コンテンツにおいて登場人物の「声」が必要になったら、ElevenLabsで生成している。
日々性能が向上しており、日本語に関しても改善が進んでいる。

プロンプトで「声」の候補を3つ生成し、意図したイメージになるまでプロンプトを変更して生成し直す。
1回の生成で350クレジット消費するが、付与されるクレジット数が大きいので残数を気にすることなく何度でも試すことができる。

自分専用のキャラクターボイスが蓄積していくので、単発の映像なら登録済みの「声」から選ぶだけだ。


効果音もElevenLabsで生成しているが、KLINGの動画生成で「動きと同期させたい」足音や爆発音などはKLINGの機能(AI Sound Effects Generator)で効果音を生成している。

Sora 2 Proは昭和製造機
引き続き、検証を兼ねて「架空の」昭和を表現している。
想像の昭和でしかないが、さすがにこれをSoraアプリの外に出すのは控えたい。Xやnoteでも公開しない方針。
Xで流れている動物動画の多くはSora 2で作られた偽物だ。低画質なので本物との区別ができない状態。
擬人化されていたり、パロディとして楽しめるものはよいのだが、倫理的にアウトなものが増えてきたので注視している。
Sora 2 Proなどは膨大な計算資源を使っているので、今のような自由な使い方が可能なのは今だけかもしれない。
検証も今のうち…

1年後、2026年後半から起こりそうなこと
これまで私たちが体験してきた生成AIのブームは、ある種「巨大な自動販売機」のようなものでした。
コインを入れるようにプロンプトを入力すれば、AIが確率的に「正解に近いもの」や「驚くようなもの」を釣り上げて提供してくれました。
この段階では、ユーザーに専門知識がなくても、AIが勝手に補完し、創造性を代行してくれたため、誰でもプロ並みの成果物を得ることができました。
しかし、今後進行していく権利関係の厳格化は、この自動販売機の中身が「誰の許可も得ていない混沌とした魅力的な商品」から、「権利処理済みの安全で規格化された商品」へと完全に入れ替えられることを意味します。
結果として、今後の「ライセンス型モデル」が生成するコンテンツは、必然的に角が取れ、平均化されたものになっていく可能性が高い。
過激な表現、特定の作家の過度な模倣、権利的にグレーゾーンにある実験的な作風などは、出力段階でフィルタリングされる。

つまり、単に言葉で指示を出すだけでは、誰もが似たような、商業的に無難な「80点」の作品しか作れなくなるという壁に直面することになります。
これが「表現の幅が狭まる」という現象の正体であり、プロンプトエンジニアリングという魔法が、その効力を失い始める瞬間でもあります。
しかし、まさにこの「AIが勝手にやってくれる領域」が狭まることこそが、逆説的に「人間のクリエイター」の出番を増やすことになります。
AIが平均的な出力しか出せなくなるのであれば、そこから逸脱した個性的で尖った作品を作るためのソースは、AIの外側、つまり人間側から供給するしかなくなるからです。
私たちは「AIを使えば誰でもクリエイターになれた幸福な時代」から「AIという高度な道具を使いこなすために、人間自身が汗をかいて素材やアイデアを練らなければならない現実の時代」へと足を踏み入れることになるかもしれません。
それは一見すると不自由で厳しい変化に見えますが、長期的には「AIが作った作品」と「人間がAIを使って作った作品」の境界線が明確になり、真に独創的なビジョンを持つ人だけが生き残る、プロフェッショナルな創作環境への回帰と言えるのかもしれません。
ローカル環境で自由を勝ち取る
「ローカル環境」の自由には「対価」と「責任」が伴うという側面も補足しなければなりません。
一つは、ハードウェアへの投資と技術的な学習コストです。クラウド側で処理していた膨大な計算を自分のPCで行うわけですから、ハードウェアの投資は避けられません。単なる「ユーザー」から「システム運用者」へと進化しなければならないのです。
もう一つは、法的なリスクの所在がすべて個人に降りかかるという点です。企業サービスを使っていれば、著作権侵害などのトラブルが発生した際、ある程度は企業の責任範囲となりますが、ローカル環境で生成したもので問題が起きれば、すべての責任は作成者にあります。
無法地帯であるということは、守ってくれる警察もいないということを意味します。
自分のマシンで生成AIを動かすことは、企業が敷いたレールの上を走る快適さを捨て、荒野を自分の足で歩く行為に似ています。
そこには道もガードレールもありませんが、どこへ向かうのも自由です。
企業が提供する生成AIサービスが「誰でも安全に使える公共交通機関」になっていく一方で、ローカル環境は「知識と技術を持つ者だけが乗りこなせる改造車」として、独自の表現を追求するクリエイターにとっての聖域であり続ける可能性は高い。
関連マガジン:
更新日:2025年12月5日(金)/公開日:2025年12月5日(金)
