你们的官方key的gpt-4o能答对三姓家奴的问题嘛?(目前推测是官方看碟下菜)

写一下一些测试(每个账号、每个模型回答5-6次,提到吕布就算对,使用官方key,非逆向)结论:
对于gpt-4o-20241120模型,四级号回答基本都对,一级号回答很少能答对
对于gpt-4o-20240806模型,四级号和一级号基本都能答对
对于gpt-4o-20240513模型,四级号和一级号基本都答错

结论:似乎2024-11-20模型的正确率与账号的级别有关(充钱真的能变强)
其他两个模型似乎不会降智(仅靠这一个问题得出的结论,不一定对)
---------------------------------------分割线--------------------------------------------
以下为原帖

我记得之前测试是百分百能区分4o-mini和4o吧? 现在好像不行了
以下截图为官key,非逆向

补充一下,目前好像o1-mini可以稳定答对,莫不是有了新模型,旧模型就默认变拉了?:

再补充一下,因为我有两个一级号,一个四级号,我用这三个号分别测试了5次,发现一级号更容易答错,而四级号基本都答对了(莫非是看碟下菜????),标准是不管回答的内容如何,只要提到吕布就算对,看下图:

一级号 1 (2/5)

一级号 2 (2/5)

四级号 (6/6)

9 个赞


ban半抽象

多试几次,会发现有时候都没有吕布,而且它很喜欢水浒传

1 个赞

:clown_face:老让我想到三家~~
我试了一圈好像只有GPT答不对

现在发图片解除降智的法子不好用了,你这个恐怕仍然是mini

我用的是官方api,也答不对


还真是我重新生成就正常了

一次就成了

但是说的不太对


居然一次性对了,感觉是随缘降智

可以多试几次,以前是能稳定答对的。看我原帖的补充

试试 0806 和 0513

官网是错的。

试了,结果如下:不管是一级号还是四级号,gpt-4o-0806的回答基本都对,gpt-4o-0513的回答基本都错。

结果如下:
一级号结果:


四级号结果:



Azure的4o

Azure有版本号嘛?比如用的gpt-4o是哪个版本的?

o1-preview和Gemini pro都能答对,其他的LLM就开始胡说八道了

github的azure。默认的。

1 个赞

其中:
4o说是高俅,
Claude 3.5 Sonnet说是吴三桂,
Gemini 1.5 Flash说是张飞,

你这个是被降智了,GPT说它识别不了你的图片你没看到吗 :laughing:

1 个赞