3070 8g显存适合运行ollama什么模型

yourgold · 2025 年7 月 31 日 16:46

已解决：win10电脑，彻底卸载ollama，重新安装可以正常运行。之前是在老版本上升级的，升级后导致无法正常运行。

几个月曾经下载过ollama本地运行大模型。能够成功运行，但是现在ollama版本升级后，反而发现运行不了。换其他的小模型也不行。都是提示内存不够。

ollama -v
ollama version is 0.10.1

ollama run qwen3:4b
Error: 500 Internal Server Error: llama runner process has terminated: error loading model: unable to allocate CUDA0 buffer

ollama run qwen3:0.6b
Error: 500 Internal Server Error: llama runner process has terminated: error loading model: unable to allocate CUDA0 buffer

3070应该是可以跑起来qwen3:4b的吧。下面的显卡信息看起来内存也没怎么被用过。请教一下佬们，是显卡性能问题，还是ollama的问题呢

rebout · 2025 年7 月 31 日 17:52

可以试试Qwen3-30B-A3B，这种是10个3B的专家模型组合的，模型比较大，相对可能好些。
或者 deepseek-r1 的 8B / 7B 比较适合。

Qwen3-30B-A3B：

tosaki · 2025 年7 月 31 日 17:53

看一下是不是用了fp16,4b跑fp16勉勉强强，算上上下文kvcache是不够的。用q8比较合理。

lkainan · 2025 年7 月 31 日 18:34

我的3060 12G的

也想找个试试

yourgold · 2025 年8 月 1 日 00:36

模型比较大适合本地跑吗，我现在是跑小模型都提示内存不够。

yourgold · 2025 年8 月 1 日 00:37

跑了qwen3:0.6b也还是同样错误。0.6b 3070应该是能跑的吧

yangkun · 2025 年8 月 1 日 00:59

ollama下载的8B模型在3070上都能随便跑的，应该是设置不对。试一下这样能不能用

$env:CUDA_VISIBLE_DEVICES="0"
ollama run qwen3:4b

AlphaCat · 2025 年8 月 1 日 01:11

我感觉这种配置不适合本地部署模型。效率比较低。

yourgold · 2025 年8 月 1 日 01:11

我也觉得跟性能没关系，早版本的ollama就能成功运行。我试试看

yourgold · 2025 年8 月 1 日 01:15

$env:CUDA_VISIBLE_DEVICES
0
PS D:\ollama> ollama run qwen3:4b
Error: 500 Internal Server Error: llama runner process has terminated: error loading model: unable to allocate CUDA0 buffer

还是不行。感觉可能是新版的ollama的问题。

yourgold · 2025 年8 月 1 日 01:15

现在是想本地跑起来看看。想解决启动不了的问题。

rebout · 2025 年8 月 1 日 01:35

这个模型速度还可以，因为是10个3b的小模型组合的。4060 8g还可以（8k）的话

yourgold · 2025 年8 月 1 日 01:41

在ollama选择的是那个模型呢，我看好像qwen官方没有这个模型。你是4060 8g跑起来的吗。我现在qwen的4b和0.6b的小模型都报错跑不起来

rebout · 2025 年8 月 1 日 01:43

qwen3：30b ollama这边就整固到一起了，就很混乱….

kk1 · 2025 年8 月 1 日 01:57

yhp666 · 2025 年8 月 1 日 02:43

8G显存
如果是非思考模型推荐下
ollama run gemma3n
思考模型的话最多可以跑
ollama run qwen3:8b

frankyuan · 2025 年8 月 1 日 11:03

改用vllm可以吗

alertsc · 2025 年8 月 1 日 11:29

最多跑跑嵌入重排，推理模型基本跑不了有实用价值的。

话题		回复	浏览量
4060ti 8G显存能跑Qwen2.5 14B吗？开发调优人工智能 , 快问快答	16	671	2025 年2 月 13 日
ollama 本地跑大模型需要什么配置？开发调优人工智能	14	493	2025 年2 月 12 日
求解AI方面的显卡装机（显存共享问题）开发调优人工智能	33	515	2025 年11 月 6 日
什么框架能最高效跑7b int4量化大模型开发调优人工智能 , 快问快答	31	352	2025 年12 月 2 日
物理机部署Qwen3-32B 需要什么配置开发调优快问快答	16	213	2026 年3 月 24 日

3070 8g显存适合运行ollama什么模型

已解决：win10电脑，彻底卸载ollama，重新安装可以正常运行。之前是在老版本上升级的，升级后导致无法正常运行。

相关话题