16g mac mini跑gpt-oss:20b, 速度感人

yangkun · 2025 年8 月 6 日 01:27

stevessr · 2025 年8 月 6 日 01:28

去用groq
20B的参数都量化成什么样子了啊

huqi · 2025 年8 月 6 日 01:31

上次哪位佬说有闲置的算力，期待部署一个

handsome · 2025 年8 月 6 日 01:45

不太行呀

Bensong · 2025 年8 月 6 日 01:51

等会试试我的16g macbook pro ，看看会不会炸

Honghurumeng · 2025 年8 月 6 日 01:53

这是什么软件啊

Bensong · 2025 年8 月 6 日 01:53

ollama

Honghurumeng · 2025 年8 月 6 日 01:54

我去，看了一下ollama更新了

但是ollama上的模型好少

stevessr · 2025 年8 月 6 日 01:57

ollama可以直接从hugging face拉模型的

Honghurumeng · 2025 年8 月 6 日 01:58

啊？有教程吗，佬，不是需要转译吗

stevessr · 2025 年8 月 6 日 01:59

部分直接就是gguf格式，可以直接用

hugging face甚至做了集成的……

Honghurumeng · 2025 年8 月 6 日 02:00

感谢，我看看

youlika · 2025 年8 月 6 日 02:19

别难为自己了，我M4 PRO 48G 跑个4bit量化的DeepSeek r1 都半天没反应

is_hp · 2025 年8 月 6 日 02:36

有时候我就很想笑究竟是谁给我的勇气……

hengrrr · 2025 年8 月 6 日 02:39

r1 671b 的超大模型和这个 20b 不是一个量级的，佬的 m4 pro 跑这个应该挺快

CossX · 2025 年8 月 6 日 02:49

能跑起来已经算不错了我24g的跑8x7b的q4km都没反应… 基本上低于128g的mac最好找>=20g以内的模型超过<=20g都很慢～

seven2024 · 2025 年8 月 6 日 02:51

我本来也想回去试试我的m3 16gb，劝退了。

CossX · 2025 年8 月 6 日 02:52

hugging face 找 gguf 的格式的模型然后右上角 use this model 那个功能菜单点开 local app 下面有 ollama 就可以直接复制粘贴到 ollama 使用了～

Honghurumeng · 2025 年8 月 6 日 02:53

嗯，刚刚研究了，谢谢

buste · 2025 年8 月 6 日 02:54

m4 16g 20b本地效果 lmstudio官方GGUF, 关闭了其他占内存的软件:

整体系统会变卡, 但不影响输出速度

话题		回复	浏览量
Mac新版Ollama(0.11.0)支持gpt-oss，带联网功能，能长时间思考，Mac mini M4成功运行gpt-oss-20b！前沿快讯 ChatGPT , 人工智能	70	1317	2025 年8 月 6 日
32G 的 m4 mac mini 能部署多大的 deepseek？开发调优快问快答	18	3113	2025 年3 月 14 日
Mac mini 适合跑什么本地模型？开发调优人工智能	22	1069	2025 年1 月 12 日
各位大佬来秀秀肌肉搞七捻三 ollama , DeepSeek , HuggingFace , 人工智能	25	660	2025 年2 月 4 日
请教佬友们，关于 ollama 的。开发调优人工智能 , 快问快答 , 配置优化	35	645	2024 年12 月 8 日