見出し画像

2025年5月以降、画像生成の方法も様変わり!(4月以前の手法は破棄する)脱プロンプトさらに進む - Blog 2025/06/16

前回の続きです。

5月からの検証で、複数の生成AIモデルの「いいとこ取り」による最終アウトプットの品質向上が確実なものとなり、現在のベストプラクティスとして定着してきました。

「Fireflyだけ」「Midjourneyだけ」といった、1つのAIモデルに固執することのデメリットは、そのAIモデルの苦手な領域を許容しなければならず、結果的に品質を低下させてしまうことでした。

Firefly Image 4 標準モデル
Firefly Image 4 標準モデル
Firefly Image 4 標準モデル
Firefly Image 4 標準モデル

同じプロンプトでも、生成AIモデルによって結果が変わります。
AIモデルごとの得意不得意が反映され、出力される内容の特徴や品質に差が生じるのです。これらの違いは、モデルの学習データ、アーキテクチャ、学習方法などの要因によって生まれます。

タスクの性質や求める結果に応じて「適切なモデルを選択する」ことが、生成AI活用の重要なポイントとなります。


Firefly Boards (beta) で複数のAIモデルを比較:

Firefly Boards (beta)

Firefly webで使用できるAIモデル(2025年6月16日現在)

  • Google Imagen 3

  • GPT Image(OpenAI ImageGen)

Firefly Boardsで使用できるAIモデル(2025年6月16日現在)

  • FLUX 1.1 Pro

  • FLUX 1.1 Ultra

  • FLUX 1.1 Ultra (Raw)

  • FLUX.1 Kontext

  • Google Imagen 3

  • Google Imagen 4

Fireflyで使用できるAIモデル(2025年6月現在)


OpenAI Image Generation による生成:

  • Firefly Image 4 構成参照で活用

OpenAI ImageGen

Midjourney v7 による生成:

※Midjourney は、Fireflyに追加されていません(公式API非公開のため、プラットフォームへの組み込みができません)。

  • Firefly Image 4 スタイル参照で活用

Midjourney v7

ChatGPT o3 によるプロンプト生成:

ChatGPT o3
ChatGPT o3
ChatGPT o3による生成プロンプトをFirefly Image 4で実行

複数の画像生成AIモデルをリミックス調整して仕上げた Firefly Image 4 の生成:

Firefly Image 4で生成した画像をLLMで解析・プロンプト生成して、OpenAI ImageGenとMidjourneyで画像生成しています(上図)。
その画像をリミックスして、最終的にFirefly Image 4で仕上げています。

Firefly Image 4 標準モデル(+ Creative Upscaler )

新しい画像生成の解説:


Adobe Firefly 上級者向けアートワーク

マルチモーダル入力、およびリミックスによる新しい画像生成のワークフローでアートワークしてみます。

初期プロトタイプ:

3DCGツール(DAZ Studio)でポージング、スクリーンショットを撮り、Fireflyの構成参照に設定。

ポーズ指定用のリファレンス

LLM解析用プロンプト:

ヘアースタイルの強度が高いので、Visual intensity(視覚的な適用量)を最小値にしないと、後ろ姿になります。AIは髪の毛を表現しようと背中を向けます。

Subject:
A Japanese young woman in her late teens with long brown hair styled in a twisted ponytail secured by a red hair tie. She wears a white ribbed tank top and denim shorts while posing dynamically with arms outstretched, creating a motion effect with her hair.
Scene:
A clean white studio background provides a minimalist setting that allows focus on the subject. The lighting is bright and even, creating subtle shadows that define form and movement.
Style:
particularly evident in the hair's flowing motion blur effect and fabric details. The lighting creates soft highlights and shadows that enhance dimensionality. Clean, crisp rendering with attention to material properties and physics simulation. motion dynamics, studio lighting, material simulation, high-detail texturing.

Firefly Image 4 標準モデル

ChatGPT o3によるヘアーデザイン:

ChatGPT o3

リミックス作業:

ChatGPT o3によるヘアースタイルをリファレンスとして使用する、もしくはプロンプト生成して利用する方法があります。
以下の場合、プロンプト生成して組み込み(1回目の生成)、生成した画像をリファレンスにしています(2回目の生成)。

Firefly Image 4 標準モデル
Firefly Image 4 標準モデル(+ Creative Upscaler )

※追記:画像にハルシネーションが残っていたので修正しました。教えていただき感謝!


ワークフローが構築されていれば、作業時間は30~40分程度です。
Photoshopの事後処理がほとんどないので、従来の作業方法より時短になっています。


注意点:

一般ユーザー向けとプロフェッショナル向けでは、重視されるアプローチが大きく異なるので再掲載しておきます。

プロの上級者が対象です。
初心者に対しては、簡易なテキストプロンプトで「それっぽい」イメージが生成できればよいので「体験」優先です。

■コンシューマー向け:

  • テキストプロンプト入力が適している

  • 意図したイメージを生成することより、「誰でも」「簡単に」生成できる「手軽さ」が重視される

  • 大量に「それっぽい」画像/動画を生成し、見栄えの良いものを選び、繋ぐだけのインスタントな作品が許容される

■プロフェッショナル向け:

  • マルチモーダル入力が適している

  • ラフスケッチやイメージ図、写真などをリファレンスにした高度な画像生成・動画生成(再混合)やカスタムモデルによって、クリエーターが意図したイメージを忠実に生成することが重視される(その代償として作業が複雑化する)

  • テキストプロンプトに依存した生成は、偶然性に頼る不安定さが以前から指摘されており、生成回数の増大、コスト高なども問題になっていた


これは、商業デザインに携わるプロフェッショナル(上級者)向けのアプローチであり、一般ユーザーに対しては(高い精度を求める必要がないため)、手軽に誰でも実行できることを価値とし、テキストプロンプト入力を推奨します。


関連マガジン:


更新日:2025年6月16日(月)/公開日:2025年6月16日(月)

いいなと思ったら応援しよう!