Gemini 新增了一个 gemini-2.0-flash-exp-image-generation 的新模型,该模型支持输出图文内容。
本次更新聚焦于更强大的图文能力和性能优化:
- 全新图文模型: 新增支持
gemini-2.0-flash-exp-image-generation模型,可生成包含图文混排的内容。 - 图片体积优化: 生成的图片将自动压缩,减小文件大小。
- 图片加载优化: 采用懒加载技术优化图片加载,减少图片渲染对文本生成速度的影响。
现在,您可以体验更丰富的图文互动和更流畅的内容生成速度!
以下是图文内容生成测试:
- 生成做菜的流程和配图:
我在学做宫保鸡丁,你可以教我做菜的步骤,并配上相应的图片么
- 测试脑筋急转弯:
我想知道怎么把一只大象装进冰箱,请列出步骤与每一步的图片
- 测试图片修改能力:
生成一辆红色跑车的图片
Gemini 应该目前唯一可以直接生成图文混排内容的大模型语言。如果说 OpenAI 开启了 AI 时代,那么 Google 的 Gemini 绝对是 AGI 时代的领跑者。
当然 Gemini 的新模型觉得不止以上几种用法,比如直接给 Gemini 一篇公众号文章,它就可以为你生成图文混排的全新文章,省去了你找图片的时间,更可以避免图片版权争议。
您可以通过部署 Gemini Next Chat ,然后选择 gemini-2.0-flash-exp-image-generation 这个模型进行试玩。
注意:目前只有 gemini-2.0-flash-exp-image-generation 这个模型支持图文内容生成
模型列表可以在项目右上角的 设置-语言模型-默认模型 进行刷新,右侧的小按钮可以手动刷新模型列表。


