ollama 支持 Windows on ARM 64

yuke · 2024 年3 月 13 日 14:44

ARM64 Windows下安装Ollama

本次测试在UTM装的Windows 11虚拟机（ARM64位）中完成。

安装Ollama

直接双击 OllamaSetup.exe，报错，

查代码，得知OllamaSetup.exe 是使用Inno Setup 打包，第一时间想到 Inno Setup Unpacker （一个可以解压缩由 Inno Setup 打包的 .exe 文件的工具）。

使用很简单

innounp.exe -x OllamaSetup.exe

程序会解压缩到当前目录下的{app}目录（没错，目录名带了花括号）,

体验Ollama

解压缩就等于安装好了，经测试可以正常使用其中 ollama app.exe 为运行server的应用，常驻系统托盘，

ollama.exe 为核心程序，用法如下，

Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama 运行ollama服务
  create      Create a model from a Modelfile 从Modelfile创建模型
  show        Show information for a model 显示模型信息
  run         Run a model 运行模型（模型不存在，则自动下载）
  pull        Pull a model from a registry 从注册表下载模型
  push        Push a model to a registry 讲本地模型推送到注册表
  list        List models 显示本地安装了哪些模型
  cp          Copy a model 拷贝模型
  rm          Remove a model 删除模型
  help        Help about any command 帮助

Flags:
  -h, --help      help for ollama
  -v, --version   Show version information

Use "ollama [command] --help" for more information about a command.

做个测试

ollama run gemma:2b

从截屏可以看出，我是在虚拟机下完成的测试：

CPU：1.00 GHz ARM 64
内存：4.00 GB
系统：Windows 11 Pro，
模型：是Google 的Gemma 2

模型推荐

阿里千文（qwen:2b, qwen:7b, qwen:14b)，自己测试哪个可以跑起来。
Google 的gemma:2b 和gemma:7b

客户端

官方推荐open-webui

这个一般建议在Docker里运行，如果本地运行，需要准备的环境比较复杂，因为它同时依赖Python和Node.js

（macOS下的截屏）

我推荐chatbox

后记

打算写这篇文章的时候，还在想，这有意义吗？虚拟机里跑那么慢，写完了才想起来，其实微软的Surface Pro X 就是ARM 64的，顺便搜了下，发现还是有不少品牌使用ARM 64 CPU的，比如华为，小米，联想，华硕，Dell等。

lzgnpl · 2024 年3 月 13 日 15:18

这个硬件要求不低吧？？

yuke · 2024 年3 月 13 日 15:21

ollama 可CPU，可GPU，我是在虚拟机里测试的，速度比较慢，具体速度没有测

macOS m2 下跑Qwen 14b（4bit量化）可以达到34token/s

Jason · 2024 年3 月 13 日 15:32

明天做一个看看

wren · 2024 年3 月 13 日 15:33

Windows 还是得靠显卡吧

yuke · 2024 年3 月 14 日 01:37

ollama 可以显卡，可以GPU，当然GPU性能好，显卡也能用

wren · 2024 年3 月 14 日 01:56

CPU 速度会慢些, 我刚水了一贴配置沉浸式翻译.

yuke · 2024 年3 月 22 日 13:37

提交了个PR， merge了，评论很有趣

neo · 2024 年8 月 29 日 06:30

From #develop:ai to #share

话题		回复	浏览量
沉浸式翻译配置Ollama 资源荟萃人工智能	100	8110	2025 年1 月 16 日
他来了,他来了本地跑模型他来了资源荟萃 ChatGPT , 人工智能	35	3572	2024 年12 月 9 日
【Ollama】 Llama3来了，用Linux Ollama线下部署你自己的大模型羊驼资源荟萃 Llama3 , 人工智能	61	5518	2024 年11 月 12 日
3分钟，拥有你的本地大模型-Ollama！【Windows篇小白向】资源荟萃人工智能	79	6144	2024 年11 月 14 日
本地小模型ollama部署测试悬赏人工智能	4	173	2026 年3 月 10 日