5060 笔记本成功部署 Gemma 4，30t/s，效果很好

Yuookie · 2026 年4 月 3 日 03:10

模型

gemma4-26b-a4b-it-q4km

30 token/s 上下

笔记本 32G 内存+5060 8GB 显卡，64k 上下文成功跑通

整个 26b 放入内存，显卡动态加载 4b 的激活参数，所以只要空闲内存≥20GB，显存≥6GB 即可

大家可以去部署试试

鸸鹋骑单车

天气卡片

25k 输入极限测试：

日常使用的首字速度

scg2017g · 2026 年4 月 3 日 03:16

用什么部署的？llama cpp？
我也试试，qwen3.5 35b刚好跑不动

sunya · 2026 年4 月 3 日 03:17

看看coding能力和跑分是不是一致

Yuookie · 2026 年4 月 3 日 03:17

codex部署的（

是llama.cpp

直接丢给ai让它帮我搞

kano233 · 2026 年4 月 3 日 03:18

这模型的显存占用要多少

Yuookie · 2026 年4 月 3 日 03:18

有什么例题吗，这个怎么测呢

22smd-mc · 2026 年4 月 3 日 03:19

测测经典的天气卡片测试看看效果

Gilfoyle · 2026 年4 月 3 日 03:20

佬这个rank网站是啥

Yuookie · 2026 年4 月 3 日 03:20

显存5.8G，但是内存已经占满了30.9个G

linuxdddddo · 2026 年4 月 3 日 03:21

佬这是什么网站啊

qdd28 · 2026 年4 月 3 日 03:22

哦豁，好像效果不错哦

Aiora · 2026 年4 月 3 日 03:41

这个显卡跑31B的试试，看性能都跟glm5、kimi2.5差不多持平了

Yuookie · 2026 年4 月 3 日 03:43

这还算可以吗，感觉就是 2.5pro

linux.do.it · 2026 年4 月 3 日 03:59

看着不错哦

LanceYang · 2026 年4 月 3 日 03:59

Q4KM这个水平感觉可以呀

qwe2 · 2026 年4 月 3 日 04:01

内存占用高吗

sczerg · 2026 年4 月 3 日 04:02

那么强啊

dididudu · 2026 年4 月 3 日 04:02

lmarean

shawn781 · 2026 年4 月 3 日 04:03

请问这种开源的模型，带审查吗？可以搞NSFW ？

test121212 · 2026 年4 月 3 日 04:03

这么厉害

希望谷歌把Pro也做的更好吧

话题		回复	浏览量
部署了gemma4:26B，在12G 显存 32 内存的机器上，跑的很流畅开发调优人工智能 , 软件开发	187	3385	2026 年4 月 14 日
实测: 接上次opus4.6蒸馏qwen3.5 27B本地部署优化方案开发调优人工智能 , 快问快答 , 纯水	29	979	2026 年4 月 13 日
真正可用的小模型来了！Qwen3.5-9B 懒人本地部署包，7个工具开箱即用开发调优人工智能 , 软件开发	140	2467	2026 年3 月 15 日
<实测>opus4.6蒸馏qwen3.5的qwopus3.5-27B-v3-8b,结尾结论,已解决接入原生claude code缓存问题开发调优人工智能 , 纯水	27	1300	2026 年4 月 14 日
Qwen3-30B-A3B 是目前（8G显存）可部署的最强本地大模型前沿快讯人工智能	44	6244	2025 年5 月 30 日