DeepSeek V3.1总算是来了

F-droid · 2025 年8 月 19 日 18:38

yeahhe · 2025 年8 月 19 日 18:39

Model size
685B params

F-droid · 2025 年8 月 19 日 18:43

仍然只是对V3的微调，对性能的提升不能抱太大希望

yeahhe · 2025 年8 月 19 日 18:45

参数量有变化，希望对数据做了筛选优化

SugarBreeze · 2025 年8 月 19 日 18:47

没变，一直都是685B

yeahhe · 2025 年8 月 19 日 18:47

之前不是671B吗

ncpsnetworks · 2025 年8 月 19 日 18:48

wow 真快讯
但是为什么深夜发

SugarBreeze · 2025 年8 月 19 日 18:49

671B是模型权重，还有14B是一个单独的模块的权重来着我记得

yeahhe · 2025 年8 月 19 日 18:50

确实，我看了一下0528,也是685

Leon.L · 2025 年8 月 19 日 18:55

HF的是685B，Github的是671B，
因为HF比github多了一个14B的令牌权重模型。
基础模型都是671B。

ERICing · 2025 年8 月 19 日 19:02

ohhhhhh 是deepseek

cabudon · 2025 年8 月 19 日 21:26

贴一个变化，挺大的，我就不说哪个才是最新版

image1363×3237 373 KB

第一个的回答把我看哭了，比gemini还催泪，没有任何提示词干扰

答案揭秘

第一个是新的，后一个是旧的

cabudon · 2025 年8 月 19 日 22:41

等等，啥意思，有人说这是混合模型，所以深度思考也升级了？ r2前瞻版？还是以后都是混合模型

cbweixin · 2025 年8 月 19 日 22:44

第一个回答绘声绘色，感觉像是讲故事，第二个像是产品说明书，没得感情。

luokky · 2025 年8 月 19 日 22:45

R2啥时候来

lvyan · 2025 年8 月 19 日 22:46

希望deepseek能快点发力吧

Grok · 2025 年8 月 19 日 22:50

有什么优势吗

supersonic_ai · 2025 年8 月 19 日 23:16

我以外有啥变化，哈哈哈

EDWINCHENC · 2025 年8 月 19 日 23:23

幻觉还是很严重

kokonomiya · 2025 年8 月 19 日 23:29

感觉中文功底更强了，一些文言文的翻译还不错

话题		回复	浏览量
今日DeepSeek官网悄悄更新v3.1？前沿快讯人工智能	46	1785	2025 年8 月 20 日
DeepSeek 模型升级至 V3.1，上下文长度拓展至 128k 前沿快讯人工智能	38	1101	2025 年8 月 19 日
deepseek 升级了v3.1模型前沿快讯人工智能	6	560	2025 年8 月 20 日
DeepSeek V3.2要来了搞七捻三人工智能 , 纯水	50	1736	2025 年9 月 29 日
DeepSeek V3.1发布前沿快讯 DeepSeek , 人工智能	22	1840	2025 年8 月 23 日