RT,和Claude 4.1 opus thinking/ gemini2.5 pro deep thinking 相比呢
3 个赞
直接用基本就是降智,感觉被 auto 了,得结合 deep research 才能展现其能力。
1 个赞
听起来还不如2.5pro deep think ![]()
之前上了team,用了几次,在推理方面,没有给我很惊艳的感觉。其他方面就不知道了。
金主站用过一两次,比那个立及o3pro还是提升很大
我用了几次感觉一般,没感觉比gpt5 thinking好多少。让他们两个同时做一道数学题,然后把他们两个的答案发给对方,他们互相说对方是错的。
我们这边的用户都说 pro 提升很大呀,而且现在 GPT-5-Pro 可以使用工具了,唯一的缺点就是还是很慢很慢。
1 个赞
能问问用户反馈的,提升较大的场景吗?
Pro在我这里的体感提升有限,可能是我的场景不是很能对上5 Pro的长处
重型长思考模型,目前最好的应该还就是5 Pro了。
之前的O3-pro其实也可以。
gemini 2.5 pro deep thinking其实一言难尽,综合体验下来是不如5 Pro的,我觉得这是2.5 pro自身的问题(量化过于严重,以至于即使延长思考也无法稳定发挥能力)。
claude的话,还是编码吧。其它方面不太能和另外两个比
需要完整任务的上下文,并且复杂度适中
GPT 5 Pro 类似于同时向好几个 GPT 5 Thinking 询问
然后一边聚合、挑选所谓的最好答案