GPT5.4疑似性能倒退?

我注意到在codex中使用gpt5.4,很多时候不如使用5.3codex
最明显的就是,类似这种场景做不了了:

https://linux.do/t/topic/1353223
比如我给出一个50项的task列表,gpt5.4会在做完第五个后进行一个小节
然后说“要不要我继续做xxx”

11 个赞

5.4 比 5.2 更会偷懒一点这个的确;

5.2 说实话, 除了速度慢, 但是质量和任务推进是不会断的

6 个赞

感同身受,每次都得让他继续

1 个赞

很明显,我写了个md任务文件,让它一项一项挨着完成并标记,他一般只会做一两项就总结然后停了

5.2最近也是喜欢早停

5.4挺快的呀感觉

1 个赞

都涸泽而渔注册疯了,能不倒退就怪了 :rofl: :laughing:

很快,但是在codex你不知道它什么时候停,所以只能盯着
5.3cx和更早的5.2则是你很确定它能连续工作很久

我感觉我把 5.4 mini 加到 claude 里效果很不错,就是不知道为啥,我用codex的时候,命令行里,ps老是卡死,然后现在都快不想用codex了 :rofl:

如果5.2的速度上来了,我情愿使用5.2而不是5.4

是容易断,但还是感觉5.4效果更好()

5.4适合用来做规划,长篇大论吹牛,

你需要一个

while grep -q -- '- \[ \]' TODO.md; do
    codex exec "干穿 TODO.md"
done
6 个赞

你是天才!

确实是的!

不不不,模型本身的问题,甚至不如5.3codex,5.2codex和5.2…至少在偷懒这块(

2 个赞

:rofl:还行,这几天都蹬冒烟了,很多项目都是修一两次过

1 个赞

这个问题,我愿称之为:GPT 5.4 早泄 :tieba_016:

2 个赞

超长任务要用GPT 5.2,5.4的老毛病又回来了,这个其实是GPT 5.2 CODEX的毛病 :rofl: 我们最近也开始后端主要用 GPT 5.2和GPT 5.3CODEX了,长任务主要是GPT 5.2

5 个赞

5.4在codex中还有个问题就是,明明已经给出新问题了,5.4还是重复在回复上一个问题

3 个赞