【模型测试】成功把grok3问死循环了

会crash吗,最终能正常给结果应该都算正常

我也试过,一直死循环,没结束:rofl:

再等了一会儿之后,思考结束了,最终给了个很明显错误的答案

没有收敛,自己结束了,这个还算正常吧,就是没做对,毕竟不是许愿机

以前国产模型经常死循环。。

导致这种死循环的原因是什么?我试过很多出名点的大模型都会有这个问题,包括
gemini-flash,mixtral ,deepseek-?,qwen.

思考token数量在偏移的某个值要有惩罚,balance没有做好就会这样

感谢解答疑惑

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。