deepseek-ai/DeepSeek-V3.2-Exp - deepseek-ai/DeepSeek-V3.2-Exp · Hugging Face
前排围观!
前排围观~~
工具使用上更好了,其他大差不差
原文提到了注意力机制,以及实验目的:长上下文的推理、训练速度
性能不变的情况下,成本降低50%以上,这个就很牛了
什么时候出R2啊
用了,会破胸嘛???
快了快了,再等等。要是问我还要多久,我就不知道了awa
没有R2 了估计
v3.1 不是已经 思考/非思考切换了么
使用体验怎么样
坐等大佬的评测