241217 三花 AI 日报:最强开源虚拟试穿模型;OpenAI 增强 ChatGPT 搜索功能;Midjourney 推出 Moodboards 功能;开源对象运动控制技术

OpenAI 增强 ChatGPT 搜索功能

OpenAI 12Days 的 12Days 活动第 8 天,官方将其命名为 ChatGPT Search Day。现在搜索功能在手机上提供更好的体验,支持视频播放和地图了。

当然,最重要的是,该功能现在免费用户也能使用了。你可以通过 search.chatgpt.com 快速打开搜索。

Midjourney 推出 Moodboards 功能,个性化模型更便捷

Midjourney 推出了 Moodboards 功能,允许用户使用自己的图像集来个性化模型,有点类似 IpAdapter 风格参考或者训练风格 LoRA,用于保持画风一致。

入口在网页左侧导航栏的 personalize 菜单中,需要订阅才能使用。

Leffa:开源的可控人物图像生成框架

Leffa 是一个开源的可控人物图像生成的统一框架,支持虚拟试穿和姿势转移。

代码和模型已经开源,能力非常不错,试穿效果媲美闭源的可灵,我愿称其为开源最强。有个在线演示,强烈推荐大伙试试。

ObjCtrl-2.5D:开源的免训练对象运动控制技术

视频:backhand_index_pointing_right:External Player - 哔哩哔哩嵌入式外链播放器

ObjCtrl-2.5D 是一种无需训练的开源对象运动控制技术,它利用深度轨迹作为控制引导,能够实现文生视频模型中相机、物体或背景的自然运动。

代码已经开源,你们可以在在线演示玩玩看,不过挺复杂的。

谷歌 Whisk:通过图像混合生成新图片

视频:backhand_index_pointing_right:External Player - 哔哩哔哩嵌入式外链播放器

Whisk 是谷歌实验室的新实验项目,用户可以通过上传或生成图像来定义主题、场景和风格,然后将它们混合生成新图片。

底层的逻辑是使用 Gemini 2 自动为图像生成 prompt,然后将其输入到 Imagen 3 中,生成最终图像。目前,该服务仅限美国用户使用。

23 个赞

来了,看报

1 个赞

看报看报

上班先看早报

链接放错了,建议发谷歌的介绍文章。

1 个赞

每天必看,赞!谢谢佬的分享

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。