你们的官方key的gpt-4o能答对三姓家奴的问题嘛？（目前推测是官方看碟下菜）

haly · 2024 年11 月 28 日 05:54

写一下一些测试（每个账号、每个模型回答5-6次，提到吕布就算对，使用官方key，非逆向）结论：
对于gpt-4o-20241120模型，四级号回答基本都对，一级号回答很少能答对
对于gpt-4o-20240806模型，四级号和一级号基本都能答对
对于gpt-4o-20240513模型，四级号和一级号基本都答错

结论：似乎2024-11-20模型的正确率与账号的级别有关（充钱真的能变强）
其他两个模型似乎不会降智（仅靠这一个问题得出的结论，不一定对）
---------------------------------------分割线--------------------------------------------
以下为原帖

我记得之前测试是百分百能区分4o-mini和4o吧? 现在好像不行了
以下截图为官key，非逆向

补充一下，目前好像o1-mini可以稳定答对，莫不是有了新模型，旧模型就默认变拉了？：

再补充一下，因为我有两个一级号，一个四级号，我用这三个号分别测试了5次，发现一级号更容易答错，而四级号基本都答对了（莫非是看碟下菜？？？？），标准是不管回答的内容如何，只要提到吕布就算对，看下图：

一级号 1 （2/5）

一级号 2 （2/5）

四级号（6/6）

lwyt · 2024 年11 月 28 日 05:56

ban半抽象

haly · 2024 年11 月 28 日 05:57

多试几次，会发现有时候都没有吕布，而且它很喜欢水浒传

xqc · 2024 年11 月 28 日 05:59

老让我想到三家~~
我试了一圈好像只有GPT答不对

Luu1997 · 2024 年11 月 28 日 06:01

现在发图片解除降智的法子不好用了，你这个恐怕仍然是mini

haly · 2024 年11 月 28 日 06:02

我用的是官方api，也答不对

xqc · 2024 年11 月 28 日 06:03

还真是我重新生成就正常了

anghunk · 2024 年11 月 28 日 06:06

一次就成了

di_mo · 2024 年11 月 28 日 06:07

但是说的不太对

yyy3 · 2024 年11 月 28 日 06:08

居然一次性对了，感觉是随缘降智

haly · 2024 年11 月 28 日 06:22

可以多试几次，以前是能稳定答对的。看我原帖的补充

bbb · 2024 年11 月 28 日 06:25

试试 0806 和 0513

handsome · 2024 年11 月 28 日 06:35

官网是错的。

haly · 2024 年11 月 28 日 06:36

试了，结果如下：不管是一级号还是四级号，gpt-4o-0806的回答基本都对，gpt-4o-0513的回答基本都错。

结果如下：
一级号结果：

四级号结果：

Mrzqd · 2024 年11 月 28 日 06:47

Azure的4o

haly · 2024 年11 月 28 日 06:52

Azure有版本号嘛？比如用的gpt-4o是哪个版本的？

entr0pia · 2024 年11 月 28 日 06:54

o1-preview和Gemini pro都能答对，其他的LLM就开始胡说八道了

Mrzqd · 2024 年11 月 28 日 06:56

github的azure。默认的。

entr0pia · 2024 年11 月 28 日 06:57

其中：
4o说是高俅，
Claude 3.5 Sonnet说是吴三桂，
Gemini 1.5 Flash说是张飞，

3.141592653 · 2024 年11 月 28 日 06:57

你这个是被降智了，GPT说它识别不了你的图片你没看到吗

话题		回复	浏览量
智谱GLM-4的数学推理也太惊艳了吧！资源荟萃人工智能	21	1207	2024 年12 月 9 日
4o降智了？资源荟萃人工智能	64	1782	2024 年11 月 30 日
实锤官网GPT4偷偷换模型资源荟萃 ChatGPT , OpenAI , 人工智能	61	4700	2024 年12 月 9 日
gpt4 网页版最近真的变得好笨啊资源荟萃 ChatGPT , 人工智能	34	1656	2024 年12 月 9 日
诸位的Plus GPT-4能回答对这个问题吗资源荟萃 ChatGPT , 人工智能	14	778	2024 年12 月 9 日

你们的官方key的gpt-4o能答对三姓家奴的问题嘛？（目前推测是官方看碟下菜）

相关话题