Cloudflare ai flux-1-schnell 出图能不能指定尺寸?

Cloudflare Workers AI 能指定尺寸出图吗?查了一下,说不行,但我见
硅基的也可以。


关于 900x383 尺寸的图片:

@cf/black-forest-labs/flux-1-schnell 模型本身并不直接支持生成任意尺寸的图片。它生成的是固定尺寸的 tiles(512x512 像素),然后 Cloudflare Workers 可以将多个 tiles 拼接成更大的图片。但是,它不能生成非正方形的图片. 如果你需要生成900x383尺寸的图, 有以下两个方法。

方法一:寻找支持自定义尺寸的模型

  1. 在 Replicate上寻找支持自定义尺寸的模型.

  2. 获取模型的API Key, 并在Cloudflare Workers代码中更新。

方法二:在生成后进行裁剪

  1. 可以通过Cloudflare Workers生成比900x383更大的正方形图(比如1024x1024)。

  2. 然后在Cloudflare Workers中对生成的图进行裁剪, 生成900x383的图片。

  • 模型限制: @cf/black-forest-labs/flux-1-schnell 模型(以及许多类似的扩散模型)在设计上是生成固定大小的图像块(tiles),通常是正方形的(如 512x512 像素)。这是模型训练和内部工作机制决定的。
  • Cloudflare Workers AI 限制: Cloudflare Workers AI 作为一个中间层,它负责调用模型,但它不能改变模型本身的输入/输出特性。

更详细的解释:

  1. 扩散模型的工作原理(简化):
  • 扩散模型(如 Stable Diffusion, Flux Schnell)通过逐步向图像添加噪声,然后再逐步去除噪声来生成图像。

  • 这个过程是在一个固定的“画布”大小上进行的,通常是正方形的。

  • 模型在训练时学习的是在这个固定大小的画布上生成图像,而不是任意大小的画布。

  1. @cf/black-forest-labs/flux-1-schnell 的情况:
  • 根据目前的信息,@cf/black-forest-labs/flux-1-schnell 模型生成的是 512x512 像素的图像块。

  • Cloudflare Workers AI 可以将多个 512x512 的块拼接成更大的 正方形 图像(如 1024x1024, 1536x1536 等),但不能直接生成任意的、非正方形的尺寸。

1 个赞

@yangtb2024 可以吗?

2 个赞

@Coker 可以吗?

2 个赞

不知道哎 :tieba_087:

2 个赞

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。