deepseek 升级了v3.1模型

围观地址deepseek-ai/DeepSeek-V3.1-Base · Hugging Face

官方api应该也升级了没测试,应该是个混合推理模型,坐等大佬评测

只发了base模型,instruct模型没发

应该是下午到晚上七八点这段时间发。。
跟着微信公众号一起发

静待发布。佬,FT说V4和R2是因为GPU的问题,你怎么看?


参考豆包和qwen的,把思考和非思考合并了,通过 thinking 参数进行控制是否进行思考

非思考

思考:

补充群友分享:

3 个赞

:grin:反正我感觉跟deepseek相关的很多文章都没啥准确度
还是等官方消息吧

1 个赞

前端现在前段时间发布的glm写的也不错,现在主要还要看指令遵循这块工具调用有没有提升