GPT5.4疑似性能倒退?

Shyliuli · 2026 年3 月 19 日 08:52

我注意到在codex中使用gpt5.4，很多时候不如使用5.3codex
最明显的就是，类似这种场景做不了了：

https://linux.do/t/topic/1353223
比如我给出一个50项的task列表，gpt5.4会在做完第五个后进行一个小节
然后说“要不要我继续做xxx”

Unic · 2026 年3 月 19 日 08:54

5.4 比 5.2 更会偷懒一点这个的确;

5.2 说实话, 除了速度慢, 但是质量和任务推进是不会断的

ameame · 2026 年3 月 19 日 08:57

感同身受，每次都得让他继续

GoldOring · 2026 年3 月 19 日 08:59

很明显，我写了个md任务文件，让它一项一项挨着完成并标记，他一般只会做一两项就总结然后停了

IkedaTeresa · 2026 年3 月 19 日 09:01

5.2最近也是喜欢早停

zeng33456 · 2026 年3 月 19 日 09:02

5.4挺快的呀感觉

miludeerforest · 2026 年3 月 19 日 09:03

都涸泽而渔注册疯了，能不倒退就怪了

Shyliuli · 2026 年3 月 19 日 09:03

很快，但是在codex你不知道它什么时候停，所以只能盯着
5.3cx和更早的5.2则是你很确定它能连续工作很久

Easul · 2026 年3 月 19 日 09:05

我感觉我把 5.4 mini 加到 claude 里效果很不错，就是不知道为啥，我用codex的时候，命令行里，ps老是卡死，然后现在都快不想用codex了

SKT.Shinyruo · 2026 年3 月 19 日 09:09

如果5.2的速度上来了，我情愿使用5.2而不是5.4

shino0 · 2026 年3 月 19 日 09:10

是容易断，但还是感觉5.4效果更好（）

sonygod · 2026 年3 月 19 日 09:12

5.4适合用来做规划，长篇大论吹牛，

admk · 2026 年3 月 19 日 09:13

你需要一个

while grep -q -- '- \[ \]' TODO.md; do
    codex exec "干穿 TODO.md"
done

Shyliuli · 2026 年3 月 19 日 09:14

你是天才！

handsome · 2026 年3 月 19 日 09:14

确实是的！

Shyliuli · 2026 年3 月 19 日 09:14

不不不，模型本身的问题，甚至不如5.3codex，5.2codex和5.2…至少在偷懒这块（

miludeerforest · 2026 年3 月 19 日 09:15

还行，这几天都蹬冒烟了，很多项目都是修一两次过

IgniteRan · 2026 年3 月 19 日 10:08

这个问题，我愿称之为：GPT 5.4 早泄

jackliu100 · 2026 年3 月 19 日 10:12

超长任务要用GPT 5.2，5.4的老毛病又回来了，这个其实是GPT 5.2 CODEX的毛病我们最近也开始后端主要用 GPT 5.2和GPT 5.3CODEX了，长任务主要是GPT 5.2

Delmar_Sparks · 2026 年3 月 19 日 11:22

5.4在codex中还有个问题就是，明明已经给出新问题了，5.4还是重复在回复上一个问题

话题		回复	浏览量
坏了，给GPT-5.3-Codex蹬得胡言乱语了搞七捻三人工智能 , 纯水	25	1298	2026 年2 月 24 日
GPT-5.3-Codex 正式发布编程性能再攀新高前沿快讯 ChatGPT , OpenAI , 人工智能	62	3607	2026 年2 月 6 日
GPT 5.4 是真强，Codex APP 里边猛猛 vibe code，Team 的额度被我一天用光了。搞七捻三 ChatGPT , OpenAI , 人工智能	23	889	2026 年3 月 8 日
gpt-5.4在长时任务上真的蛮半成品的搞七捻三纯水	38	592	2026 年3 月 7 日
如果你有用不完的codex，那我推荐你用用这个开源项目开发调优软件开发	22	623	2026 年3 月 15 日