DeepSeek 模型升级至 V3.1,上下文长度拓展至 128k

【通知】DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k,欢迎前往官方网页、APP、小程序测试,API接口调用方式保持不变。

结合下面这个新闻看,deepseek 最近应该有大动作

LmArena发布了两款新的 DeepSeek 模型,代号分别为“一个非常秘密且有趣的模型”和“一个高度机密且快乐的机器人”。

9 个赞

0324?

不是,看起来这个v3.1是混合推理模型,现在官网开启思考模型回复的已经是v3而不是r1了,r1已经没了

3 个赞

试了下确实是,

居然是新模型

新模型?

居然是新模型


兄弟们 R1 真下了

第三方还没有更新啊,看看硅基流动什么时候更新

印象中v3 0324当时的开源版本就是支持128K上下文的吧?只是官网只提供64K。有没有可能只是现在才把满血给放出来,除了上下文这点以外别的地方其实没什么提升?

1 个赞

你的猜想应该没错,有更新官网肯定会有文档说明提升的方面

这个问题准吗?我觉得没有用

应该会有的,之前也都是先在群里说一下,之后官网才更新。而且目前深度思考说自己是 V3,应该更新挺大的。

1 个赞

换了版本号肯定是有更新的

不会吧,真下了那API的价格算r1还是v3的

等一个r2

v3.1 不是0324吗,这么久怎么就憋出一个小升级来

终于等到deepseek更新了

V3.1是老外的叫法,如果只是上下文长度变化应该不会提api调用方式不变这句话

LmArena 上今天新增了两个 deepseek 的模型,感觉大的应该快发布了