o3-pro思考时间打榜

gpt team也是用上o3-pro了,心血来潮,设计了一个上下文极长的任务给它,看看它完成的情况和耗时。

看看佬友们的o3-pro能思考多久呢?

我这次是思考了23m4s。

3 个赞

有人要拼车吗

能拼车吗?

思考冠軍

2 个赞

20分钟也是好起来了

思考的久一定好吗?小学生思考10分钟,抵得过大学生的1分钟吗,总觉得这是奥特曼的坑,拿时间换算力的玩法

2 个赞

这玩意对用户是个黑盒,想的久总比十几秒出答案质量高点

1 个赞

想得久可能只是撞 64k 或者 100k 的最长输出了,倒是可以用这个来测输出的 tok/s

我觉得给出的上下文太少,o3-pro就会没有足够的材料去分析推理,于是会过度思考。
如果给足了上下文,以及问题的边界,o3-pro的能力边界,就可以得到比较符合预取的结果。

有拼车的吗

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。