huggingface上的模型一般是用什么部署的呢?

KlNonR · 2025 年4 月 15 日 01:17

听说GLM-4-32B在某些部分超出了4o,我想在本地上部署玩一下.
然而在ollama中没有32b的模型,所以我想询问一下该如何本地部署huggingface上的模型呢?

freebsdfx · 2025 年4 月 15 日 01:54

下载官方的gguf文件就可以，ollama可以从单个文件导入模型，直接能用。

thereisnospoon · 2025 年4 月 15 日 01:55

推荐lmstudio

KlNonR · 2025 年4 月 15 日 01:58

有官方的gguf的吗,我一直以为是社区的

KlNonR · 2025 年4 月 15 日 01:58

好的,我看一下

freebsdfx · 2025 年4 月 15 日 02:13

好像ollama不行，我看老外说当前直接用gguf稳定性很差，应该是官方架构和vllm有区别，需要给llama.cpp加补丁才行。

freebsdfx · 2025 年4 月 15 日 02:17

LM Studio还用不了，unknown model architecture: ‘glm4’

所以deepseek才要开源推理代码，新模型内部都是私货。

KlNonR · 2025 年4 月 15 日 02:25

那有推荐的部署工具吗?

freebsdfx · 2025 年4 月 15 日 02:35

就用官方的vllm呗，32B那么大的模型，已经不是ollama这种小玩具玩玩的了，只能用AI显卡+linux跑企业内部服务。

admini · 2025 年4 月 15 日 02:37

llama.cpp 自己量化后部署

KlNonR · 2025 年4 月 15 日 02:44

4090还是能勉强本地跑跑的,我试试vllm好了

system · 2025 年5 月 15 日 02:44

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
开源大模型的本地部署,本地大语言模型部署工具对比：Ollama vs LM Studio 如何选择适合自己的 AI 助手开发调优快问快答	5	584	2025 年3 月 10 日
各位大佬，有没有本地部署大模型的教程开发调优快问快答	20	1395	2024 年12 月 9 日
各位大佬来秀秀肌肉搞七捻三 ollama , DeepSeek , HuggingFace , 人工智能	25	660	2025 年2 月 4 日
除了Ollama还有其他适合本地运行LLM的软件吗开发调优人工智能	27	606	2025 年7 月 3 日
佬们有本地部署的语言模型推荐吗搞七捻三人工智能	18	1577	2024 年12 月 9 日