字节新模型seedream4.0已经上架即梦AI,GPT和谷歌生图的劲敌姗姗来迟

字节新模型seedream4.0已经上架即梦AI,本来小道消息说是10号上的,现在可能是小范围偷偷上限测试,宣传文案都还是即将发布。

Seedream4.0应该也是采用了和gemini-2.5-flash-image(nano banana)和GPT-image-1的技术,在自家小LLM(十几B到一百多B)的基础上冻结权重新增生图功能的,也许是AR的方案,不过技术报告还没发布,要等等了。
由于采用了类似的技术,而不是传统的diffusion模型塞更多更大的T5类似物,Seedream4.0、gemini-2.5-flash-image(nano banana)和GPT-image-1的改图能力都较为接近,在我的私有测试集中(比较难,而且经常有非常多ood的case)这三者的改图综合能力比较接近,都是在这类问题上擅长,在另一个问题上可能就不擅长了,有些ood的问题仨模型都是束手无策,所有AI基本都束手无策。所以其实这三个模型没有太大的代差,在很多问题上也可以互补:


图为我的测试集的一部分截图,图中红色为完全不可用,黄色为要大修,绿色为及格60分或以上,稍微改改或许就能用,可以看到很多case现有的模型都不行,而基本绿色的都集中在Seedream4.0、gemini-2.5-flash-image(nano banana)和GPT-image-1这三个模型里,虽然他们也有很多红色或者黄色的。

现在在即梦AI里登陆就能用,免费账户每天80积分,一张图一积分,一次四张图,能跑20个prompt。有两个水印,会员可以去掉右下角水印。过两天这个模型应该就可以在豆包上使用了。

随便写了点,但是我测试和平时使用的时候有更多有趣的观察和结论(毕竟玩AI生图改图快四年了):关于每个改图模型的能力和性能边界,以及要如何使用自然语言模型,每个模型有什么脾气秉性?想看的佬友可以留言,人多了我可以再开一贴~

15 个赞

来支持了

1 个赞

佬给个主观排行榜吧

1 个赞

综合来说 不如banana

请教一下,Banana 有好的支持中文字体展示的方式吗?尝试过制作字体图片,然后去两图融合,效果不太好。

第一点是即梦每日积分不定 在合理范围内波动,可能可以达到100甚至200多
第二点是豆包被命中内测的可以用了。按照你的小道消息的话 10号全面上线是正常的

1 个赞

好像中文是不行的,有的佬友说文字垫图还行啊,可能每个人用起来还是有差异性吧

1 个赞

可以啊!

国内也就字节的大模型稍微靠谱点了

还是期待qwen-image升级,开源才能爽用

正常,seed底模本来就不如gemini

没开源呢,还是等等qwen的

明白了,谢谢大佬

早点上豆包 :partying_face: