[2.21] ChatGPT 降智个人总结

美国校园网 IP,之前从未降智,今天使用 ChatGPT App 和 ChatGPT Web 的时候均遇到 o3-mini-high 模型降智的情况。

表现及判断依据:o3-mini-high 思考为旧样式,且时间极短。

使用论坛中 【长期更新Wiki】语言模型区分题库:主要用来区分语言模型,也能测试逻辑能力 测试,o3-mini-high 使用旧样式思考的回答完全错误。

但此时使用 GPT-4o,不管是列出所有工具还是画苹果,都没有出现降智问题,这我还是第一次遇到,如果有佬友跟我一样的可以分享一下~ :lark_001:

吓死我了,刚看完论坛里其他佬友封号的帖子就收到了 OpenAI 的邮件,我还以为我账号也被封了,打开一看是这玩意… :cold_sweat:

2.22 测试:降智情况已解除。

2 个赞

正常的,这样只针对高级模型降智的措施oai已经干了很久了,

2 个赞

而且这个cot就是把一句话重复表述,压根没有分析的意思

2 个赞

现在降智已经算轻的了,今天才封号一波。

15 个赞

已经投奔Grok了

3 个赞

Grok的基础模型和思考模型都很不错,基础模型能力比4o要强,联网能力也足够优秀。图片识别能力才要GPT

1 个赞

图像和OCR还是Gemini2.0proexp,GPT变数太大,太容易降智。

1 个赞

大佬,grok3和claude3.5 v2比较呢

gemini更新模型以后图像能力下降太多,以前1206是巅峰,现在不如o1

2 个赞

AI 五子棋网站(Grok-3思考版 2 轮对话生成) - #2,来自 yeahhe

claude写不出

1 个赞

我看它API还有1206的id,不知道是不是原生的

1 个赞

图片识别这一块现在我用倒贴的Gemini

我这web和app全面降智,GPT-4o也降,不过Tasks调用的是正常智力模型。写邮件后客服回答:

Upon review, we have detected potential account-sharing activity on your OpenAI account, which may conflict with our Terms of Service. As a result, your account has been temporarily downgraded.

服了

4 个赞

grok 3基础模型的代码能力应该不如claude 3.5 sonnet

演都不演了

看来claude写代码确实是一绝

草了 真承认降智了

:tieba_087: 放弃Openai吧

我这可是原生的美国大学 IP,我用所有的 OpenAI 服务都是这一个 IP,这也能降智我是没想到的,看来他们本国的人估计也经常反馈降智了 zzzz…

1 个赞

不能用grok的基础模型对比claude的高级模型。而且grok基础模型能免费用很多次,思考版模型也能免费用