钢丝球炒蛋很难吗?很多大模型都过不了

啥情况?gpt4o也过不了

7 个赞

正确答案是啥?我挺好奇的

3 个赞

你用的是假的

3 个赞

钢丝球不能炒蛋,这不是一道菜

2 个赞

那google回答可以啊

2 个赞

现在人类的提问水平已经这么高了么

2 个赞

官网的4o也试了,同样不对

1 个赞

我用的Coze.com里的Gpt 4o模型,回答的一样,不清楚是不是coze 的问题,coze 不可能造假吧?

2 个赞

emmmm
不好评价,看4o的回答甚至让我挺想试试的 :crazy_face:

3 个赞

哈哈哈哈哈,确实还不错

3 个赞

会不会我们误解了gpt4o,他的钢丝球不是让你吃的,让你当磨具的

1 个赞



试了几遍,开了plus和普通的4o回答的确不一样。

3 个赞

笑死我了

2 个赞

他的钢丝球不是用来吃的,说是创意菜品

1 个赞

claude3 opus

1 个赞

你這是把異食癖給忽略了 :face_with_peeking_eye:

2 个赞

这类题型都是注意力测试,测试模型对重点的抓取能力。
性能完全取决于模型参数,参数越大性能越强。没有任何优化方法。
4o虽然才发布没多久,不过已经被openai蒸馏成了弱智,不要把4o当gpt4看待,要当3.5

2 个赞

4o也错了?我咋记得能过啊?

1 个赞

这就不得不提一嘴claude3 opus了。能过钢丝球炒蛋,并且论文写作第一好手。

4 个赞

开了plus的GPT-4o,也ok啊。没有产生幻觉。

1 个赞