deepseek R1已经本地部署好了，然后如何愉快的玩耍呢？

oUjg3 · 2025 年2 月 7 日 07:24

deepseek R1 32b已经ollama本地部署好了，和官方700多b的比较还是很弱智，很多它都不知道。如何把它调教成至少某个领域的专家呢？或者至少某个软件/某个技能的专家？

xuxu123 · 2025 年2 月 7 日 07:25

搬个小板凳等着大佬来讲解

liu0076 · 2025 年2 月 7 日 07:26

占个位置

2770450518 · 2025 年2 月 7 日 07:27

躺在地上喝茶，等大佬講解

ZoeKyHein · 2025 年2 月 7 日 07:27

围观学习一下

lvsedd · 2025 年2 月 7 日 07:35

前排围观

eugeneL · 2025 年2 月 7 日 07:36

没有用感觉还不如原版 32b 的

DSUK · 2025 年2 月 7 日 07:37

没用的，你下载的模型都是训练出来的

Zeus_Jie · 2025 年2 月 7 日 07:39

输入你好！
你是谁？
然后开始删除清理工作

nameliu · 2025 年2 月 7 日 07:42

没研究过微调，不过之前那个$50微调Qwen2.5-32B-Instruct的论文，可以试试。
准备环境是16个H100一起运行26分钟

https://arxiv.org/abs/2501.19393

他们的数据集在这里，已经整理好数学问题和gemini-2.0-flash-thinking-exp-01-21的思考过程和结果了。

微调的代码在这里

我没有试过，没有机器，上面只是理论可行。

等一位大佬实际运行看看

whongf · 2025 年2 月 7 日 07:43

本地的话结合知识库？

user1108 · 2025 年2 月 7 日 07:55

奈何电脑跑不动32b，我4060ti 8G显存跑14b，才8到9个token每秒

Throttle · 2025 年2 月 7 日 09:51

可以做一个工作流，把对应的知识预检索后一起丢给大模型

GPT-5 · 2025 年2 月 7 日 10:00

用在cherry studio的知识库，应该是足够了吧

krrj · 2025 年2 月 7 日 10:14

外面套个壳子，然后内网穿透给我用

system · 2025 年3 月 9 日 10:15

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
deepseek-r1:1.5b 真的有点用吗？开发调优快问快答	29	1061	2025 年2 月 23 日
成功本地部署deepseek，效果侍讨论评价开发调优人工智能 , 纯水	23	1071	2025 年3 月 6 日
DeepSeek-R1 开源版来了！！前沿快讯 DeepSeek , 人工智能	52	2281	2025 年2 月 20 日
🔥deepseek。。。终于等到你开发调优人工智能	43	2373	2025 年3 月 1 日
deepseek 本地部署是不是就纯本地推理了，还能联网回答吗？开发调优 DeepSeek , 人工智能 , 快问快答	17	979	2025 年3 月 8 日