4060ti 8G显存能跑Qwen2.5 14B吗？

Realm · 2025 年1 月 14 日 10:14

大佬们，想用ollama跑本地模型，请问 4060ti 8G显存能跑Qwen2.5 14B吗？

stevessr · 2025 年1 月 14 日 10:16

stevessr · 2025 年1 月 14 日 10:17

看起来直接就是不够啊，要不在量化一下

Realm · 2025 年1 月 14 日 10:18

降档到7B可以不？

stevessr · 2025 年1 月 14 日 10:19

还是得用量化的版本
~~不然部分权重可能放到内存（共享显存）里面降低了速度~~

Realm · 2025 年1 月 14 日 10:19

明白了，感谢佬

XGCoder · 2025 年1 月 14 日 10:20

下载个 LM studio 可以自动检测, 当前设备是否支持某个模型本地部署

Realm · 2025 年1 月 14 日 10:22

感谢，我去试一下

oswald522 · 2025 年1 月 14 日 10:27

其实不完全看gpu，内存够大就行。一般选择k5，qlm其实差不太多。

XGCoder · 2025 年1 月 14 日 10:29

下载后可能 LM studio 不能加载模型数据, 需要把配置中的 huggingface 替换为 hf-mirror , 网上搜一下就有很多教程

图片这里可以看当前模型的是否支持, 如果支持,可以点击下面的按钮下载即可

Saber2683 · 2025 年1 月 14 日 10:30

可以！ollama的推理后端llama.cpp会把尽量多的layer放到gpu上，放不下的放cpu，所以答案是可以。

如果追求使用体验，试试7b

Zhuifeng · 2025 年1 月 14 日 11:01

我笔记本8g能跑翻译

4396 · 2025 年1 月 14 日 11:03

能跑但是会炸内存

rubyrose · 2025 年1 月 14 日 12:09

我的OLLAMAN能跑吃了7.2G显存和 50%的CPU

KXG · 2025 年1 月 14 日 12:11

llama.cpp 来量化一下应该能跑，可以试试

ZoroAster · 2025 年1 月 14 日 12:35

8g显存，不如调用api了。或者尝试cpu跑，虽然会非常慢，但至少能跑。

system · 2025 年2 月 13 日 12:36

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
4060ti 8G显存 32内存能跑 R1 8B吗开发调优软件开发	34	1045	2025 年3 月 7 日
3070 8g显存适合运行ollama什么模型开发调优人工智能	17	532	2025 年8 月 1 日
Qwen3-30B-A3B 是目前（8G显存）可部署的最强本地大模型前沿快讯人工智能	44	6232	2025 年5 月 30 日
16G内存16GGPU跑Qwen-7B-Instruct怎么样？开发调优人工智能 , 快问快答	13	679	2024 年12 月 4 日
物理机部署Qwen3-32B 需要什么配置开发调优快问快答	16	213	2026 年3 月 24 日