会crash吗,最终能正常给结果应该都算正常
我也试过,一直死循环,没结束![]()
再等了一会儿之后,思考结束了,最终给了个很明显错误的答案
没有收敛,自己结束了,这个还算正常吧,就是没做对,毕竟不是许愿机
以前国产模型经常死循环。。
导致这种死循环的原因是什么?我试过很多出名点的大模型都会有这个问题,包括
gemini-flash,mixtral ,deepseek-?,qwen.
思考token数量在偏移的某个值要有惩罚,balance没有做好就会这样
感谢解答疑惑
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。
