公司给配的工作站，佬们帮忙看看可以本地部署多大的模型

Leeszzz · 2026 年1 月 27 日 06:55

配置清单：

佬们有什么模型推荐?

image405×556 9.08 KB

vvanglro · 2026 年1 月 27 日 06:56

qwen235b

Leeszzz · 2026 年1 月 27 日 06:56

能搞这么大的？

gooker · 2026 年1 月 27 日 06:57

32b 还得,.,

kise_tyxml · 2026 年1 月 27 日 06:58

只用GPU推理？还是用CPU？

Leeszzz · 2026 年1 月 27 日 06:59

还得什么？有哪个模型推荐吗

Leeszzz · 2026 年1 月 27 日 07:00

哪个效果好就用哪个，我也不太懂

vvanglro · 2026 年1 月 27 日 07:01

应该可以，好像可以卸载一部分到内存啊

popy · 2026 年1 月 27 日 07:01

开源的就这几个吧

ssdys · 2026 年1 月 27 日 07:02

内存大就是好，70b模型加量化都能跑

gooker · 2026 年1 月 27 日 07:05

考虑跑的快,70b量化够了,但是慢, 最好用vllm 差不多可以并发qwen 32b

Leeszzz · 2026 年1 月 27 日 07:06

我去研究研究

Leeszzz · 2026 年1 月 27 日 07:07

这些参数量都有些大吧，不一定能跑起来吧，主要是想看看极限能部署哪个参数量的模型

ATRI · 2026 年1 月 27 日 07:07

看用途和使用人数，人数不多可以部署满血的qwen/ds

Leeszzz · 2026 年1 月 27 日 07:08

就是慢一点是吧？

Leeszzz · 2026 年1 月 27 日 07:08

好的，谢谢佬，意思是32b的快，70b量化的慢一点？

Leeszzz · 2026 年1 月 27 日 07:09

这台工作站我一个人使用，没有其他人用

lovecat · 2026 年1 月 27 日 07:09

48gb vram

大一點的都要上內存

速度上差了點但是還能跑很多大模型的 8 bit量化

羨慕了

家裡只有40 gb vram 128gb內存

ATRI · 2026 年1 月 27 日 07:09

直接部署满血版就完事了，qwen 不太清楚，ds这机器感觉应该能跑到10t/s

ssdys · 2026 年1 月 27 日 07:10

应该不满，gpu 70b 没加cpu

话题		回复	浏览量
关于服务器部署大模型搞七捻三快问快答	18	353	2025 年4 月 3 日
公司预算20-50w，有佬知道可以部署什么本地部署大模型？搞七捻三快问快答 , 纯水	31	915	2025 年3 月 30 日
部署满血版R1最低需要什么配置？开发调优 ChatGPT , 人工智能 , 快问快答	36	971	2025 年4 月 12 日
零刻的GTR9Pro好强搞七捻三 ollama , 人工智能 , 纯水	28	986	2026 年1 月 9 日
1.6万的的台式机配置清单用来搞AI研究-大家帮忙看看合理吗搞七捻三人工智能 , 快问快答	48	803	2025 年3 月 20 日