32B以下适合本地部署的大模型性能最推荐的是什么🤔

hylouis · 2026 年4 月 3 日 17:43

各位佬友，求教32B以下的大模型性能最佳的是神马，想要做FP4量化后部署在本地上。看Gemma4好强，有没有佬实测过，能和qwen或者是阶跃星辰的模型比吗？

Az0809 · 2026 年4 月 3 日 17:53

我部署了这几个，
hy-mt1.5-1.8b = 用来翻译
gemma-4-e4b-it = 用来AI润色优化语音识别的内容
然后中文场景下，感觉还是qwen3.5好一点

hylouis · 2026 年4 月 3 日 17:55

佬，想请问26b这个moe怎么样哇，尤其是和qwen35B比起来的话？
代码能力工具调用能力体感感觉如何?

Az0809 · 2026 年4 月 3 日 18:00

我用这些模型都没有编写代码的场景，不太清楚代码能力怎么样
感觉千问3.5工具调用还挺积极的
gemma还没深度使用刚开始用

neon98 · 2026 年4 月 3 日 18:09

em 32b以下还是要看具体使用场景吧像楼上说的针对任务选模型可以参考各种能力榜单

whstu · 2026 年4 月 3 日 19:28

gemma4 31B和qwen3.5 27B都试试看

LMDUzMm4 · 2026 年4 月 3 日 23:14

qwen3.5 27B 或者 gemma4 31B 选一个把，这两密集模型性能几乎五五开。
我昨天看过的测试里非中英语言，逻辑推理上 gemma 会更强一些，视觉理解等qwen3.5 会更强一些。
qwen3.5 27B 已经接近 moe 的 qwen3.5 122B-A10B了，除非真的很追求速度，小模型不要用moe模型。

Jason_ghost · 2026 年4 月 4 日 03:27

中文场景那肯定国产的模型要更好啊，这不是毋庸置疑的吗，论非中文场景那也gemma的绝对优势，训练的语料决定的

话题		回复	浏览量
佬们觉得目前本地部署最好的小模型是哪个搞七捻三人工智能 , 快问快答	2	215	2025 年8 月 24 日
Gemma4也太强了前沿快讯人工智能	45	2325	2026 年4 月 3 日
谷歌最新发布Gemma2 2B，据说是同等参数下最强模型资源荟萃人工智能	70	1277	2024 年12 月 9 日
佬们，手上有一块 RTX4090 能本地部署的最强大模型是什么？开发调优人工智能 , 快问快答	23	931	2025 年7 月 9 日
部署了gemma4:26B，在12G 显存 32 内存的机器上，跑的很流畅开发调优人工智能 , 软件开发	135	1760	2026 年4 月 4 日

32B以下适合本地部署的大模型性能最推荐的是什么🤔

相关话题