在gpt的team里用同一个问题对比o3-pro和deep research(据说team的deep research前十次是o3满血)。o3-pro整整思考了13分钟,结果最后才输出了十几行;而deep research才思考了六分半钟,最后输出上百行。虽说不一定内容多就好,但在输出不算多的情况下为什么o3-pro要思考这么久,而且得到的回答也没感觉有多好 ![]()
奢侈品,思考 Tokens 也计费的虽然网页版是订阅制,但那也得跟 API 版一样啊思考链越长越显尊贵。一个 Hi 思考 13 分钟就问你庶民玩家的廉价模型能吗?!
o3-pro定位就是旗舰思考模型呢www
专门骗让有钱的人用的啦www
不是说o3和o3pro本质上是同一个模型吗?不是有相关的猜测认为o3pro就是问了十遍o3,再让o3投票产生一个最好的。虽然不知道是不是真的,如果是的话,就是不计成本的一次探索了
底模是一样的,都是O3,按照O1的情况的话,是强制思考更长时间的O3.就是建立在一种认为只要投入更多算力,让模型思考更多时间,效果就会更好的思想上的产物.结果就是一个简单的打招呼都要思考几分钟
那么,问问各位佬,gpt 哪个最好用?
用多了,搞的人精神也错乱了
感觉就是凑数的。
近期我感觉gemini好用,o1 pro没了之后,gpt系列的输出长度全面溃败.o3现在一大特征就是输出非常少.抛开这些不谈我个人感觉o3在解决非简单问题上是最好用的.之前看到过一个分析,说是o3底模的能力其实很差(典型如9.9-9.11都答不对),但是运用工具的能力极强,非常擅长利用各种工具解决问题,所以面对一些复杂问题表现的反而好(尤其是数理这方面,ai之前一大问题就是数理能力非常差,这是底层原理决定的.但是代码的数理能力很好啊,所以依赖于代码解释器而不是自身模型能力的o3反而在数理方面优势很大).而o3 pro,目前看来有点过思考了,很多问题其实根本不需要那么长的思考时间.所以我感觉个人用户的话plus足够了.当然,如果能薅个1刀team的话,那还是1个月team香
你怎么说话这么奇怪
(为啥我这里o3-pro只写用了13分钟也没有给出推理过程。。。
更加全面的思考和搜索吧
有钱人:我只是有钱我不是傻www
有o3的deep research不用非用这个意义不明的o3-pro吗www
deep research没有api且限额也明显少于o3-pro
算是顶级吧
我怀疑O3-pro现在是故意拖时间实际用了多少算力存疑(毕竟他把思维链都隐藏了),
大家可以试试基本上问啥问题,第一次思考都是统一的13分钟,接着继续用O3-pro提问,思考时间就会显著缩短。
其次O3-pro的读图能力显著不如O3,已知O3会调用工具多次放大图片细节来读图,O3-pro使用下来,识别拍照的题目就容易出错
我的理解是,如果是需要思考至少十几分钟的问题,那用一次deep research的配额应该也是值得的;如果没有需要那么深入分析的话,那o3也许也足够适用?至于api的话不知道有没有dalao和o3的对比过效果呢
原来是这样的吗。。。这个“13分钟”居然是设定好的吗 ![]()
目前是的,我试了挺多问题都是第一次思考13分钟,可能多1,2秒,
再接着问就思考变短了
感谢分享。
最近发现 openai 和 gemini ,这两位,计算 9.9减9.11 结果都是 负的0点21,
是巧合吗?
最近用了o3 pro真的很生气,写的东西太拉跨了,而且不听我指令