DeepSeek-V3.2-Exp's thinking in the Text Arena

文本领域新开放模型! 竞争最激烈的领域迎来新竞争者,来自 DeepSeek-V3.2-Exp 的思考变体已进入前十。

亮点:

开放模型:DeepSeek-V3.2-Exp-Thinking,总排名第 9

开放模型:DeepSeek-V3.2-Exp,总排名第 11 两者均采用 MIT 许可证。

介绍 DeepSeek-V3.2-Exp — 我们最新的实验模型! !基于 V3.1-Terminus 构建,它首次推出 DeepSeek 稀疏注意力(DSA),以实现更快速、更高效的长期上下文训练与推理。

现已在 App、Web 和 API 上上线。

API 价格降低 50%+!

8 个赞

是不是打算3.3.4.5.6.7.8.9.10通通出一遍 :melting_face:
打造AI级第一例大满贯

下一个应该就是 V4 了 :thinking:

V3 → V3-0324 是因为基模不变,继续训练的只是 Instruct/Chat 版本

V3 → V3.1 是因为 V3.1 的基模基于 V3 继续训练

V3.1 → V3.2 是因为 V3.2 换了一种架构,提高推理效率,但是并无性能提升

2 个赞

网页版对话有吗?没看到呀

然后应该是V3.2.1啦w)

2 个赞

在软件工程里面, 一般换架构会升主版本号, 而且这次发布在成本上有显著优化, 版本号升 V4 是完全可以的

我猜测真正的 V4 在他们内部已经出来了, 在等一个时机发布 …

2 个赞

deep seek 现在幻觉情况怎么样了? 我之前来优化文本体验极差

会不会有 V3.6.5

请问 这是哪个网站,官网上没这个选项

1 个赞

按照惯例。 春节?