省流
目前不联网只有o1-mini和零一万物能答对,o1-preview没测
现在是2024年12月1日,还有多少天过中国的农历新年
ChatGPT-4o
联网搜索相当于作弊,重来
错了,下一位
o1-mini
有误差,但算对了
deepseek
越来越感觉国内外模型都差不多了,当然gemini 1.5 flash除外,那个是真垃圾,和几年前人工智障一样,很多问题都不能答
deepseek R1-lite
误差有点大,算错了
零一万物
有人把除夕算过年,这个AI把初一当天也算进倒计时,也算对,不愧是排行榜里国内模型第一,当初这个李开复的模型就爆出改开源模型当自研,现在不会逆袭就靠它了吧,创新起步还是靠抄啊,不过入门学什么抄是第一步,希望再接再厉
通义千问
没有办法关闭搜索,不过全错了,当初开源模型刷榜大捷,可惜现在被新兴模型比下去了,不只是这个问题,而是很多问题和使用上,感觉这半年没进步,逆水行舟不进则退,希望最后不要成为阿里的kpi产品
kimi
数据有问题,前面ai是算2024年的农历新年,这个则是数据错了。后续它那个数学版也错了
grok-beta
需要绕两个弯,还是错了
sonnet v2
知道是2025年的,不过数据错了
o1-mini能答对很意外,不过如果提示词修改一下4o也能答对,这点只能针对那些25年农历新年日期正确的模型,如果是错误日期提示词再修改也没救了
这个问题不联网只有o1-mini和零一万物能答对,如果联网+提示词优化,猜测所有模型都能做对,算日期所有模型在24年底都是可以的
大部分人是使用中转和第三方站吧,这个问题刚好能测特定模型有没有灌水、造假。几个月内都是可以的吧。这个问题能测o1-mini的
























