我注意到在codex中使用gpt5.4,很多时候不如使用5.3codex
最明显的就是,类似这种场景做不了了:
https://linux.do/t/topic/1353223
比如我给出一个50项的task列表,gpt5.4会在做完第五个后进行一个小节
然后说“要不要我继续做xxx”
我注意到在codex中使用gpt5.4,很多时候不如使用5.3codex
最明显的就是,类似这种场景做不了了:
https://linux.do/t/topic/1353223
比如我给出一个50项的task列表,gpt5.4会在做完第五个后进行一个小节
然后说“要不要我继续做xxx”
5.4 比 5.2 更会偷懒一点这个的确;
5.2 说实话, 除了速度慢, 但是质量和任务推进是不会断的
感同身受,每次都得让他继续
很明显,我写了个md任务文件,让它一项一项挨着完成并标记,他一般只会做一两项就总结然后停了
5.2最近也是喜欢早停
5.4挺快的呀感觉
都涸泽而渔注册疯了,能不倒退就怪了
![]()
很快,但是在codex你不知道它什么时候停,所以只能盯着
5.3cx和更早的5.2则是你很确定它能连续工作很久
我感觉我把 5.4 mini 加到 claude 里效果很不错,就是不知道为啥,我用codex的时候,命令行里,ps老是卡死,然后现在都快不想用codex了 ![]()
如果5.2的速度上来了,我情愿使用5.2而不是5.4
是容易断,但还是感觉5.4效果更好()
5.4适合用来做规划,长篇大论吹牛,
你需要一个
while grep -q -- '- \[ \]' TODO.md; do
codex exec "干穿 TODO.md"
done
你是天才!
确实是的!
不不不,模型本身的问题,甚至不如5.3codex,5.2codex和5.2…至少在偷懒这块(
还行,这几天都蹬冒烟了,很多项目都是修一两次过
这个问题,我愿称之为:GPT 5.4 早泄 ![]()
超长任务要用GPT 5.2,5.4的老毛病又回来了,这个其实是GPT 5.2 CODEX的毛病
我们最近也开始后端主要用 GPT 5.2和GPT 5.3CODEX了,长任务主要是GPT 5.2
5.4在codex中还有个问题就是,明明已经给出新问题了,5.4还是重复在回复上一个问题