语言模型逻辑能力大比拼,挑战chatgpt-o1模型

在正四棱台 ABCD-A1B1C1D1中,AB=2,A1B1=1,AA1=√2,则该棱台的体积为多少?

答案7√6/6
目前o1 mini,o1 preview,deepseek-r1-lite-preview,Kimi数学版轻松作对。阿里QwQ小概率能做对


已知 8 段共阳极 LED 数码管要显示字符“5”(a 段为最低位),此时的段码为 _______。

答案92H

难度相对上面那题较低

14 个赞

1 个赞

好几个模型都试不出来

9 个赞

gemini可以概率答对tieba_087

4 个赞


QWQ接近了

9 个赞

1 个赞

2 个赞

QwQ,经过自己反复论证,最终给出了正确结果。还是很强大的。

4 个赞


利用prompt,deepseek完美回答正确!

3 个赞

什么提示词啊?

10 个赞

gemini,你需要给他一个提示词,让他对自己的结果进行仔细检查论证,确保无误再得出最终结论。他就会先输出一个结果,然后论证,然后修正,直到给出正确的结果。

4 个赞

没人测Claude吗?我试了Claude一次过:blush:

2 个赞


deepseek+提示词,试了3次对了

9 个赞

咱们论坛里的,忘了在哪看的了,一大串英文,仿o1逻辑的提示词! :joy:

1 个赞

我的o1p得试3次,
楼主是稳定答对吗?

2 个赞

我一次就对了!

2 个赞

那估计和我用的同一个

9 个赞

o1-mini 倒是第一次就对了

2 个赞

嗯呐咱俩应该用的一样的!

1 个赞

对,稳定答对。不过我的是API版本

1 个赞