Cloudflare Workers AI 能指定尺寸出图吗?查了一下,说不行,但我见
硅基的也可以。
关于 900x383 尺寸的图片:
@cf/black-forest-labs/flux-1-schnell 模型本身并不直接支持生成任意尺寸的图片。它生成的是固定尺寸的 tiles(512x512 像素),然后 Cloudflare Workers 可以将多个 tiles 拼接成更大的图片。但是,它不能生成非正方形的图片. 如果你需要生成900x383尺寸的图, 有以下两个方法。
方法一:寻找支持自定义尺寸的模型
-
在 Replicate上寻找支持自定义尺寸的模型.
-
获取模型的API Key, 并在Cloudflare Workers代码中更新。
方法二:在生成后进行裁剪
-
可以通过Cloudflare Workers生成比900x383更大的正方形图(比如1024x1024)。
-
然后在Cloudflare Workers中对生成的图进行裁剪, 生成900x383的图片。
- 模型限制: @cf/black-forest-labs/flux-1-schnell 模型(以及许多类似的扩散模型)在设计上是生成固定大小的图像块(tiles),通常是正方形的(如 512x512 像素)。这是模型训练和内部工作机制决定的。
- Cloudflare Workers AI 限制: Cloudflare Workers AI 作为一个中间层,它负责调用模型,但它不能改变模型本身的输入/输出特性。
更详细的解释:
- 扩散模型的工作原理(简化):
-
扩散模型(如 Stable Diffusion, Flux Schnell)通过逐步向图像添加噪声,然后再逐步去除噪声来生成图像。
-
这个过程是在一个固定的“画布”大小上进行的,通常是正方形的。
-
模型在训练时学习的是在这个固定大小的画布上生成图像,而不是任意大小的画布。
- @cf/black-forest-labs/flux-1-schnell 的情况:
-
根据目前的信息,@cf/black-forest-labs/flux-1-schnell 模型生成的是 512x512 像素的图像块。
-
Cloudflare Workers AI 可以将多个 512x512 的块拼接成更大的 正方形 图像(如 1024x1024, 1536x1536 等),但不能直接生成任意的、非正方形的尺寸。

