一个问题,让deepseek的r1思考了好几页都不对

一个班级总共有30名学生。心理学、社会学和市场营销专业的学生人数分别是总人数的$\frac{2}{5}\frac{4}{15}\frac{1}{3}$。问:这三门课程中,最多有多少名学生同时报名了其中的两门课程?


这个滚轮条。结果最后还是错的,到底什么模型才能弄对啊,主要我自己也不知道怎么做,只知道是15。

3 个赞

目前我用过什么o1、gemini think,都不行,主要我自己凑我都凑不到15个。。。。很尴尬

1 个赞

假的o1吧,我o1mini都做出来了

两次都成功了,应该是能稳定答对的,o1不可能答不对啊

{4B1F4A97-2EF9-47EC-B9A1-F43DC90A4708}

gemini thinking也能答对

1 个赞

分别是几个几个呀??为什么我之前o1 pro都搞不定,我再试试

1 个赞

我认为这个问题是错误的, 题干中只提到了”专业“、“人数”这两个词, 但是问题却问“课程“相关问题, 而”课程“在题干中没有任何约束。

我最开始见到这个问题是在 @yeahhe 佬的测试题库里, 当时问了题目来源, 但结果是来源目前已不可查, 并且目前没有人能讲明白这个题, 我自己也不会。所以 mozi佬最后把这个问题删除了

这个问题应该是遗失了某些条件的, 原问题应该会有其他的更多约束。

更多信息可以去mozi佬的题库贴里爬爬楼

7 个赞

这道题以前确实在题库里,但是有人反应题目不正确就删除了

2 个赞

deepseekr1回答0个

o1逆向回答15


o1mini回答15

o1能对吗?

反正问呗 就问这个题是不是做不出来
用了31秒

o1思考了四分半回答的是这个,感觉过度思考了

我感觉像是,ai有个误区就是,觉得必须每人都有报名。所以就会出现思考很久很久最后有0这个答案。但是还是基本答不对。。

没吧,mini和thinking的思路都是假设选一门的和三门的为0来达到选两门的最大化,我觉着着思路貌似没毛病,因为没有限定学生必须选课

1 个赞

不降智的o1是能做对这道题的:
image

o1-mini做不对这道题:


o1-pro可以做对,但思考特别久:


Gemini-2.0-flash-thinking-01-21几秒钟搞定。

这道题其实逻辑上没多复杂,主要是题干理解有歧义

那这一共才15名学生,剩下15个人不上课了? :joy:


把30人的条件删了这道题才能做。

只能说上面做出来的模型,反而是没有思考过题干的 :joy:

我上面也说了,mini和thinking的思路都是假设选一门的和三门的为0来达到选两门的最大化,因为没有规定学生必须选课,感觉可能是模型过度思考了,非得把30个人才安排了才会觉得无解

2 个赞

是的,就是这样 :+1:

1 个赞

是的,单从这个问题看R1推理数学不太行,需要提示“学生可以不报名任何课程”才能回答正确。

而gemini thinking可以直接做对

R1的Cot里有一句话,直接排除了学生可以不报名的选项:

错误推理:但这里题目中的总人数是30,所以每个学生至少属于一个专业,但可能属于多个

这就是过度思考了,简称脑补,算是cot模型的一种幻觉现象,r1这点确实做的不太好,r1 lite的过度思考尤其严重,等ds看看有没有办法优化吧