有没有一些测试大模型的难题?以此来分辨一个模型的智力

如题,就是一些只有顶尖模型(类似于o1,claude ops)才能回答得上来的一些难题

有类似的一些难题网站吗?(鲁迅和打鸟的问题就算了,现在国内的一些捞炮模型都能回答了,怕不是专门对这个问题训练过)

要的就是一些及其复杂的数学题或者推理题,一拳就能干碎国内所谓比肩gpt o1大模型的题目

1 个赞

不建议在这样的测试中浪费精力,还是从专业需求出发,一用便知

3 个赞

看看这个

2 个赞

我觉得用半天发现模型不对或者能力不足才是浪费时间

支持使用这个

ok,谢谢

1 个赞

https://omni-math.github.io

1 个赞

牛逼,赞了

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。