腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

综合排序丨最热优先丨最新优先

o3 deep research: 智能体的应用和演进

【相关】Xiao Hong Red：肖弘其人万字长文解析 LLM-native Agent 及其混合计算方式o3 deep research: LLM 驱动的 Agent 综述Agent：数字代理的崛起与未来 Agent元年：从聊天机器人到数字员工的当代进化史生成式AI学习中容易混淆的几个术语思维链是大模型的符号神助攻再谈自然模态数据是高维空间的低维流形深度学习的局限性研究综述o3 deep research : 深度学习局限性研究报告深度学习的基石：多层感知机o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析RPA 赛道与大模型Copilots早期创业者的困局Transformer

2025-03-10

8950

标签:

OpenAI 的 o3 — AGI 还是闪亮的幻影？

是的，o3 碾压了 ARC-AGI 测试。但这些基准就像由试图打败它们的工程师设计的障碍课程。o3 真的智能吗？还是仅仅针对游戏进行了优化？在这里，o3 的表现引发了有关智力是关于适应性还是实现预定里程碑的问题。数学、编码、科学——o3 在结构化领域中令人眼花缭乱。但智力存在于非结构化、混乱、情感化的领域。意识是一个棘手的话题，但怀疑论者认为，没有自我意识，o3 就不智能——它只是一个聪明的模仿者。而且，o3 不了解它自己的存在或它在世界中的位置。它计算。它不反思。尽管 o3 拥有令人印象深刻的能力，但它仍然缺乏 AGI 的基本品质，突出了专业成功与真正通用智能之间的差距。最终，关于 o3 的辩论不仅仅关乎 AI——它关乎我们自身。如果 o3 可以执行曾经是人类思维领域独有的任务，那么这会把我们置于何地？ OpenAI 正在采用一种前瞻性的方法来确保 o3 和 o3 Mini 的安全性。

石臻臻的杂货铺[同名公众号]

2025-06-03

3700

标签:

o3 deep research: LLM 驱动的 Agent 综述

General components of an agentfrom developer.nvidia.comLLM智能代理的一般架构示意图（made by ChatGPT o3）Agent接收用户请求 OpenAI 最新的智能体表现是基于其推理模型o3的 Deep Research 功能，可以就任何题目自动搜寻资料、研读并汇总融合成全面完整、信息可追溯的综述性调查报告。（本文就是 o3 deep research 完成。） Agent：数字代理的崛起与未来Agent元年：从聊天机器人到数字员工的当代进化史生成式AI学习中容易混淆的几个术语思维链是大模型的符号神助攻再谈自然模态数据是高维空间的低维流形深度学习的局限性研究综述o3 deep research: 深度学习局限性研究报告深度学习的基石：多层感知机o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析RPA 赛道与大模型Copilots早期创业者的困局

2025-03-09

1.2K0

标签:

【AGI-Eval评测报告 NO.6】o3 o4-mini 文本权威评测：o3 强势登顶

o3 和 o4 mini 的全方位评测结果来啦！o3 直接在文本推理方向上登顶！在交互能力和指令遵循等方面处于领先地位，但在知识储备方向稍显不足。目录： 1. o3 和 o4 mini评测分析 1.1 评测概述 1.2 o3 评测结果 1.3 o4-mini评测结果 2. o3 和 o4 mini 信息回顾 1.o3 和 o4 接下来我们继续为大家拆解 o3 和 o4-mini 的详细评测内容 1.2 o3 评测结果 o3 核心结论： o3 在综合能力上表现优异，尤其在交互能力、推理能力和指令遵循方面处于领先地位。同类型模型能力对比：本次评测，我们基于自建的通用能力评测集与公开评测集，将 OpenAI o3 与 o1 进行了对比：在通用能力上，OpenAI o3 水位优于 OpenAI o1，其中推理能力有明显提升实测翻车率略高虽然 o3 和 o4 mini 在实测中有不少翻车案例，但是在更加全面、科学的评测中，我们印证了 OpenAI o3 是 OpenAI 最强大的推理模型，它推动了编码、数学、科学、视觉感知等领域的发展

AGI-Eval评测社区

2025-05-08

4970

标签:

腾讯混元生图

实测OpenAI发布的o3和o4-mini模型

在4月16日晚，OpenAI 发布了两款全新推理模型——o3 和 o4‑mini。那么o3、o4-mini和GPT-4.1到底有什么区别呢？这张图可以很好的总结下来：推理 vs. 速度o3 在推理能力上评分最高，但速度是最慢的，适合对思考深度要求极高且可接受较慢响应的场景。价格梯度o4‑mini ≪ GPT‑4.1 ≪ o3，输出 token 单价差距最大（4.4→8→40 美元）。目前o3和o4-mini两个模型相比以前我觉得最大的改变就是可以进行“网页搜索”和“图像输入分析”。写在最后从 o3 和 o4-mini 的发布可以看出，OpenAI 正在加速推动语言模型向智能体形态转变的进程。

算法一只狗

2025-04-22

1.1K0

标签:

腾讯技术创作特训营S13

小米玄戒O3曝光：主频超4GHz！

4月29日消息，继去年小米成功推出首款3nm自研旗舰SoC玄戒O1并实现超百万颗出货之后，其下一代旗舰SoC——玄戒O3（XRING O3）的核心细节近日被曝光。原本外界认为小米第二代旗舰SoC名为“玄戒O2”，但根据现有的消息来看，命名直接跳到了“玄戒O3”，制程工艺可能将由台积电N3E升级到了N3P工艺。其中，玄戒O3的超大核主频进一步提升至4.05GHz，能效核频率也提高到了3.02GHz，标志着小米自研芯片团队在架构设计与功耗控制上得到了进一步的提升。图形处理方面，玄戒O3的GPU频率从1.2GHz跃升至近1.5GHz，渲染能力提升约25%，这对于驱动折叠屏的高刷新率体验至关重要。内存方面，玄戒O1和玄戒O3产品均锁定在9600MT/s，在保证顶级带宽的同时控制了功耗。玄戒O3将由小米高端折叠屏旗舰MIX Fold 5首发搭载，售价或高达1500美元。

2026-05-06

2710

标签:

GPT o3智商已超越99%的人类，碾压Deepseek！

GPT o3 是一个高级推理模型，具备主动调用联网搜索、图片分析、文件解析和数据分析等工具的能力，如同一个AI智能体。今天，我将测试 o3 模型在文献检索方面的应用，我会提供一段文本，让 o3 根据内容进行推理，并寻找相关的引用参考文献。请在文本末尾提供参考文献列表及原文链接：「粘贴需要引用文献的段落」 o3模型思考过程本次 o3 模型检索文献仅用时1分8秒，整个思考过程联网搜索了8个网络来源。从思考过程来看，o3检索的文献均来自于核心数据库，如PubMed、Science、Nature等。 o3模型输出结果从结果来看，o3 严格按照要求，在文本末尾列出了所引用文献的作者和发表年份，同时还提供了符合标准格式的参考文献条目及对应的 DOI 链接。

2025-05-21

9570

标签:

OpenAI Operator 智能体升级核心解读（AI模型4o→o3）

模型升级‌底层模型从 ‌GPT-4o‌ 升级至 ‌o3‌，显著提升推理能力与任务完成稳定性。 o3 作为 OpenAI 新推出的“推理专用模型”，在数学逻辑、复杂任务分解及动态策略调整上表现更优，尤其在浏览器操作的容错率和意图理解精准度方面进步明显。2. 安全性增强‌o3 模型集成专门针对计算机使用场景的微调数据集，降低非法操作（如隐私数据爬取）的执行概率。强化对抗性攻击（如提示注入）的防御能力，并通过多层防护机制确保操作合规性。通过底层模型从GPT-4o到o3的跃迁，不仅实现了推理能力的质变（任务成功率提升35%），更在浏览器交互稳定性（容错率提升60%）和复杂任务处理（支持8+步骤连贯执行）方面取得突破。

2025-05-26

6020

标签:

OpenAI正式发布o3 - 通往AGI的路上，已经没有了任何阻碍。

直接到o3。而OpenAI直播一完，X上基本就沸腾了。 o3的能力，对现在所有模型，几乎都直接是降维打击。看下o3的能力吧。一些粗的评测集简单过一下。这是考察 o3 是否能像一流的软件工程师一样写出完美的代码。 o3 的成绩：71.7%，比o1还强了不少。右边的那个基准比较猛，Codeforces，一个全球著名的编码竞赛平台。 o3的得分是2727，这个得分，相当于整个榜单的第175名，已经超越了99.99%的人类了。 o1的代码能力已经强到爆炸了，而o3，又向AGI的山顶，前进了一大步。而这一次，o3直接达到了25.2。当各大其他模型都还在卷传统数学基准的时候，o3真的已经进入了另一个世界了。。。就像大家还在大斗师阶段互相卷，你是五星大斗师，我是八星大斗师。网址在此：https://openai.com/index/early-access-for-safety-testing/ 目前不知道o3什么时候放出，但是OpenAI又基于o3，训了3个小尺寸的o3

数字生命卡兹克

2025-04-14

3730

标签:

o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析

后记才试了一下 openai o3 最新推出的 deep research 功能，不能不说，作为研究工具，非常给力，完成后的成品具有直接发表的水平，想做一点后编辑都难。有点叹为观止的感觉，堪称完美。

2025-02-28

8490

标签:

腾讯云智能体开发平台