241217 三花 AI 日报：最强开源虚拟试穿模型；OpenAI 增强 ChatGPT 搜索功能；Midjourney 推出 Moodboards 功能；开源对象运动控制技术

ke_jun · 2024 年12 月 17 日 01:21

OpenAI 12Days 的 12Days 活动第 8 天，官方将其命名为 ChatGPT Search Day。现在搜索功能在手机上提供更好的体验，支持视频播放和地图了。

当然，最重要的是，该功能现在免费用户也能使用了。你可以通过 search.chatgpt.com 快速打开搜索。

Midjourney 推出了 Moodboards 功能，允许用户使用自己的图像集来个性化模型，有点类似 IpAdapter 风格参考或者训练风格 LoRA，用于保持画风一致。

入口在网页左侧导航栏的 personalize 菜单中，需要订阅才能使用。

Leffa 是一个开源的可控人物图像生成的统一框架，支持虚拟试穿和姿势转移。

代码和模型已经开源，能力非常不错，试穿效果媲美闭源的可灵，我愿称其为开源最强。有个在线演示，强烈推荐大伙试试。

ObjCtrl-2.5D 是一种无需训练的开源对象运动控制技术，它利用深度轨迹作为控制引导，能够实现文生视频模型中相机、物体或背景的自然运动。

代码已经开源，你们可以在在线演示玩玩看，不过挺复杂的。

Whisk 是谷歌实验室的新实验项目，用户可以通过上传或生成图像来定义主题、场景和风格，然后将它们混合生成新图片。

底层的逻辑是使用 Gemini 2 自动为图像生成 prompt，然后将其输入到 Imagen 3 中，生成最终图像。目前，该服务仅限美国用户使用。

handsome · 2024 年12 月 17 日 01:33

来了，看报

luojizhihen · 2024 年12 月 17 日 01:36

看报看报

YoungChany · 2024 年12 月 17 日 01:57

上班先看早报

NBXX · 2024 年12 月 17 日 03:12

链接放错了，建议发谷歌的介绍文章。

supersuper · 2024 年12 月 18 日 06:42

每天必看，赞！谢谢佬的分享

system · 2025 年1 月 17 日 06:42

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
【AI早报 2025-05-20】微软召开 Build 2025 开发者大会，发布多项 AI 工具更新前沿快讯人工智能	25	736	2025 年6 月 19 日
24826 三花 AI 日报：开源实时换脸；快手虚拟试衣；全新交互代码编辑器；提示工程从入门到精通；Cursor AI Rules 提示词库；实时视频生成资源荟萃人工智能	19	953	2024 年12 月 9 日
24829 三花 AI 日报；更好的风格迁移技术；开源首尾帧图生视频；真 AI 游戏“渲染”引擎；交互式文生图 3D 布局控制；谷歌 Gems：类似 GPTs 的功能前沿快讯人工智能	6	328	2024 年12 月 9 日
241212 三花AI日报：谷歌推出 Gemini 2.0 Flash Experimental；谷歌发布多款 AI Agent 项目；开源的跳舞视频生成技术；OneDiffusion 正式开源；前沿快讯人工智能	17	760	2025 年1 月 12 日
24919 三花AI日报：英伟达可商用角色扮演小模型；Logo 设计模型 Playground v3；YouTube Dream Screen；谷歌 NotebookLM：陪读小助手；CogVideoX-I2V：开源图生视频前沿快讯人工智能	11	484	2024 年12 月 9 日