佬们有本地部署的语言模型推荐吗

anka · 2024 年10 月 21 日 02:17

就玩玩跑团这种文字游戏用，我这边显卡是3080ti laptop 16g，有推荐的模型吗？

handsome · 2024 年10 月 21 日 02:27

本地的可能不够啊

passerby · 2024 年10 月 21 日 02:31

同问想跑跑酒馆玩玩，有啥本地模型比较好用吗？

bbznop · 2024 年10 月 21 日 02:32

用 ollama 部署 qwen2.5 14b 试试

loki · 2024 年10 月 21 日 02:39

可以试试 qwen2.5 7b 的量化模型，非量化应该显存不够

q4011243 · 2024 年10 月 21 日 03:23

问下佬们，大概多少显存能跑，4070TiSuper 16G 够不够

lengxi · 2024 年10 月 21 日 03:24

我目前在用的

PLA81 · 2024 年10 月 21 日 03:27

大佬，你这个怎么安装使用的，有教程不？

cece · 2024 年10 月 21 日 03:30

使用的是这个还可以感觉

underwry · 2024 年10 月 21 日 06:08

holzora · 2024 年10 月 21 日 06:19

中文的glm-4-9b，qwen-2.5-14b

Mowd · 2024 年10 月 21 日 14:09

8GB可以跑7b上下的模型，16, 32, 64 以類推

5song · 2024 年10 月 21 日 18:32

Jason · 2024 年10 月 22 日 04:30

qwen还是可以的

PLA81 · 2024 年10 月 22 日 15:11

感谢您，感谢分享

damin · 2024 年10 月 23 日 07:10

玩ollama不玩破限？试试这个，直接ollama run 接上后面的model名称就好，包括hugging face

feahter · 2024 年10 月 23 日 07:11

目前qwen2.5可能是比较好的选择

anka · 2024 年10 月 23 日 15:14

很方便,感谢分享

话题		回复	浏览量
关于核显玩llm的问题开发调优人工智能 , 快问快答	17	619	2024 年12 月 9 日
求推荐可以本地部署的AI大模型搞七捻三人工智能 , 快问快答	28	953	2024 年12 月 9 日
llama模型推荐资源荟萃人工智能	19	556	2024 年8 月 29 日
大家在本地部署了什么模型？搞七捻三人工智能	34	1249	2025 年6 月 8 日
佬友有没有跑过开源大语言模型的开发调优 Llama3 , 快问快答	23	760	2024 年12 月 9 日