24913三花AI日报： OpenAI o1-preview 正式发布; Suno AI: Covers 翻唱任何声音; “进入”Midjourney 生成的图像；v0.dev 现在支持 Vue；Cluade 生成词语海报；ComfyUI-LF;将 HTML 数据清洗为 Markdown 的模型;

ke_jun · 2024 年9 月 13 日 01:21

三花 AI 一觉醒来发生了什么？欢迎阅读

“进入”或沉浸式探索 Midjourney 生成的图像

v0.dev 现在支持 Vue、Svelte 和 Remix

汉语新解：Cluade 生成词语海报

ComfyUI-LF: 改进用户体验的节点包

Reader-LM：将 HTML 数据清洗为 Markdown 的模型

OpenAI o1-preview 正式发布

Suno AI: Covers 翻唱任何声音

“进入”或沉浸式探索 Midjourney 生成的图像

Midjourney 正在开发一种全新的 3D 技术，这种技术将允许用户“进入”或以更沉浸的方式探索其生成的图像。这种技术不是传统的 3D 格式（如 Polygons、NeRF（神经辐射场，将二维图像重建为三维场景）或高斯模型），而是一种类似 NeRF 的新格式

v0.dev 现在支持 Vue、Svelte 和 Remix

v0 又发布了新功能，现在不仅支持 React 和 Next.js，还支持 Vue 和 Svelte 以及 Remix 框架了。

顺带一提，OpenAI 现在的前端使用的便是 Remix 框架。

汉语新解：Cluade 生成词语海报

来自即刻网友李继刚，使用 LISP 语言编写的提示词，可以直接让 Claude 生成一个词语全新角度的解释并使用 SVG 布局成一个卡片，非常好玩，完整提示词可以去作者那复制。

可以发散下，直接使用 Claude 做设计排版，已经看到有人拿来做了简历卡片。Claude 还是非常的强啊，试了其他几个模型包括 GPT4 都没法做到

这么好的效果。

还有人做了一个残血版的在线演示汉语新解，似乎只用到的文案生成，并没有完全由 AI 绘制 SVG。

ComfyUI-LF: 改进用户体验的节点包

ComfyUI-LF 包含非常多有用的节点，列举几个：

图像直方图：分析图片 RGB 通道直方图
关键字计数器：计算提示词的关键词分布的条形图
CivitAI 兼容的元数据信息：直接解析 C 站网友共享的提示词和配置
图片加载器，支持子文件夹
保存图片元数据为 C 站兼容的
一大堆对 JSON 输入输出和处理的节点
用于结合 LLM 的节点
各种开关节点

感觉最有用的就是 CivitAI 兼容元数据的输入和输出了，一直以来就是 ComfyUI 的一大痛点。

Reader-LM：将 HTML 数据清洗为 Markdown 的模型

Reader-LM 是 Jina AI 推出的一个开源小模型，专用于将网页 HTML 内容清洗为 Markdown 格式，提供了 1.5B 和 0.5B 两种参数。

他们本身也有一个同样功能的 Jina Reader 的产品，不过其技术原理是首先使用无头浏览器获取 HTML，然后使用 Readability 提取主要内容，最后使用正则和 Turndown 清理并转为 MD 格式，但存在解析错误或误删的问题，并且维护大量的正则还要支持多语言非常痛苦，于是该模型应运而生。

Reader-LM 在 HTML2Markdown 任务上的表现远超 gpt4o 等大模型，即使是 0.5B 版本也遥遥领先，最近也有类似的需求正好可以尝试尝试。

你可以在这里试用在线演示maxiw/HTML-to-Markdown，体感上比 markdownify 的效果要稍好一些。

OpenAI o1-preview 正式发布

OpenAI 发布了 o1-preview 和 o1-mini，专用于解决复杂问题的系列模型。与之前的模型相比，新模型在回复用户前会先进行思考，能更好的进行复杂任务推理并解决更困难的问题。

缺点就是速度非常的慢，在官方演示的视频中 o1-preview 单次响应要 32 秒，o1-mini 要 9 秒，而 GPT-4o 只需 3 秒

目前只有 ChatGPT Plus 、Team 用户和 API 可以使用，并且有非常严格的速率限制：

o1-preview 模型：每周最多可以发送 30 条消息。
o1-mini 模型：每周最多可以发送 50 条消息。
API 用户每分钟只能发送 20 次请求

新模型现在也不支持浏览、文件上传和工具集成，不过未来会逐步更新，并且也会逐步开放 o1-mini 模型给所有免费用户。

Suno AI: Covers 翻唱任何声音

Suno AI 发布新功能 Covers，可以翻唱任何声音为全新风格但保留旋律，此功能目前仅面向 Pro/Premier 订阅用户。

ke_jun · 2024 年9 月 13 日 01:24

@anghunk 这是一条带有多个b站视频的帖子。

推荐将播放器替换为 html5mobileplayer

aepax · 2024 年9 月 13 日 01:24

来了来了

anghunk · 2024 年9 月 13 日 01:26

mark zsbd

shangguan · 2024 年9 月 13 日 01:32

每日一看，感觉o1还是量太少了

handsome · 2024 年9 月 13 日 01:33

来了，每日看报

Myqwn2729 · 2024 年9 月 13 日 01:34

整理的好，特别是一开始的小标题总结

luojizhihen · 2024 年9 月 13 日 01:38

来啦来啦，每日必看

XPong · 2024 年9 月 13 日 01:41

O1的提升效果感觉不是很明显，是我打开的方式不对吗

ke_jun · 2024 年9 月 13 日 01:49

相信自己，你是对的

ke_jun · 2024 年9 月 13 日 01:50

感谢支持哈

lihaha · 2024 年9 月 13 日 02:07

v0.dev是类似openwebui的模型前端界面吗，里面这个吐字这么快是模型的优势还是新的前端界面给的优势呢。

Chris1990 · 2024 年9 月 13 日 02:08

openai终于有动静了

Borber · 2024 年9 月 13 日 02:16

超感兴趣

lihaha · 2024 年9 月 13 日 02:19

残血汉语新解都这么强了，不敢想原版多强

lihaha · 2024 年9 月 13 日 02:19

转md的使用场景是什么欸

zhangdahao37 · 2024 年9 月 13 日 02:35

李继刚这个提示词算是火出圈了

iblackhack · 2024 年9 月 13 日 02:56

大模型联网搜索功能可以这么理解

Caun · 2024 年9 月 13 日 03:14

这个功能不错

Flail7127 · 2024 年9 月 13 日 04:12

专门用于生成代码的，模型都是用 Claude 或者 GPT，没法当作日常聊天使用，而且很贵

话题		回复	浏览量
24918 三花 AI 日报：字节音乐生成框架；Dream Machine 现已推出 API；Mistral AI 模型大降价；腾讯视频深度预处理；开源扩图小工具前沿快讯人工智能	8	447	2024 年12 月 9 日
24912 三花AI日报：Adobe 视频模型；书生筑梦 2.0 视频模型；科学文献评审Agent；从 0 训练大模型；1分钟 16K 图片生成；最强开源中文 TTS；ComfyUI对口型节点；今天内容特别多，进来看吧前沿快讯人工智能	7	558	2024 年12 月 9 日
24906 三花 AI 日报：百大 AI 人物；Flux LoRA 画廊；提示词管理工具；Claude AI 企业版开源平替；字节数字人头技术前沿快讯人工智能	12	513	2024 年12 月 9 日
最新模型 Chatgpt-4o-latest 怎么样，邀请大家来分享使用心得资源荟萃 ChatGPT , 人工智能	53	1829	2024 年12 月 9 日
250307 三花AI日报：Mistral AI 推出号称世界最强 OCR；腾讯开源混元图生视频模型；NotaGen 古典音乐生成模型；Windsurf Wave 4 发布：新增 Preview 功能；ChatGPT for macOS 更新：IDEs 内直接编辑代码前沿快讯人工智能	31	1039	2025 年4 月 6 日

24913三花AI日报： OpenAI o1-preview 正式发布; Suno AI: Covers 翻唱任何声音; “进入”Midjourney 生成的图像；v0.dev 现在支持 Vue；Cluade 生成词语海报；ComfyUI-LF;将 HTML 数据清洗为 Markdown 的模型;

“进入”或沉浸式探索 Midjourney 生成的图像

v0.dev 现在支持 Vue、Svelte 和 Remix

汉语新解：Cluade 生成词语海报

ComfyUI-LF: 改进用户体验的节点包

Reader-LM：将 HTML 数据清洗为 Markdown 的模型

OpenAI o1-preview 正式发布

Suno AI: Covers 翻唱任何声音

相关话题