佬友有没有跑过开源大语言模型的

Aceblue · 2024 年4 月 28 日 01:42

最近跑了下Llama, 太抽象了, 想知道有没有稍微好用点的llm

do2 · 2024 年4 月 28 日 01:45

有些微调模型对参数要求特别严格，诸如联通Llama3 8B 我只有完全按照它们的样例把参数写到配置文件里才好一点。

ggbound · 2024 年4 月 28 日 01:46

中文换国内的开源模型呗，我跑的是 Qwen1.5

Aceblue · 2024 年4 月 28 日 01:47

就是中英文都有需求, 所以想试试llama微调的中文版本

Aceblue · 2024 年4 月 28 日 01:48

原来如此, 我直接用的默认配置

baipiaodang · 2024 年4 月 28 日 01:48

机子不行，只能羡慕

admini · 2024 年4 月 28 日 01:50

360 智脑 7B - 360K 还是不错的。我还是喜欢 Llama3 自己训练

Aceblue · 2024 年4 月 28 日 01:51

是有这个计划, 等下月就开始自己fine tune

wo_zu_long · 2024 年4 月 28 日 01:53

默认llama中文没有微调，是跟智障一样，你hello试试

ggbound · 2024 年4 月 28 日 01:53

国内开源的模型也不是不支持英文，主要看你的大部分场景在哪里

不过 llama 的语料大部分是英文，中文只靠微调的效果跟大部分语料是中文的比怎么样？

MacKenLia · 2024 年4 月 28 日 01:54

用的 ollama 效果感觉很不错，CPU 也能玩

Aceblue · 2024 年4 月 28 日 02:02

Aceblue · 2024 年4 月 28 日 02:03

不道啊。我搞CV的, 最近想搞llm玩一下

Aceblue · 2024 年4 月 28 日 02:04

不过我觉得仅就中文任务上说, 微调的肯定是不如大部分语料是中文的

user135 · 2024 年4 月 28 日 06:56

了解一下

Aceblue · 2024 年4 月 28 日 07:08

太帅啦！哥们瞅瞅

lora · 2024 年4 月 28 日 08:39

自己有一个24G显存的游戏主机，刚开始时，市面上的开源模型基本都测试过，个人感觉，百川和书生这2个开源模型比较好用，llama2对中文支持不好，3没测过

lleiwang · 2024 年4 月 28 日 08:53

我用的也是这个，搭配 jan 配置的remote api上的图形化界面

另外也用 lm-studio

do2 · 2024 年4 月 28 日 08:53

如果给 llama3 原始模型加上内置的让他回复中文的提示也不错，，

原版内置系统中文提示

联通版

lleiwang · 2024 年4 月 28 日 08:54

3也不是很好

话题		回复	浏览量
一句话通过ollama调整llama3的中文回复资源荟萃 Llama3 , ollama , 人工智能	25	3062	2024 年12 月 9 日
🚀 快来试试来自清华博士王慎执版Llama3 模型，表现不错！(已下线）资源荟萃 ChatGPT , Llama3 , 人工智能	60	2926	2024 年12 月 9 日
🚀部署了一个 Llama3 欢迎大家来玩！【Meta 最新 Llama 3 8B 和 70B模型】资源荟萃人工智能	65	3343	2024 年12 月 9 日
🚀内置回复中文规则的Llama3 70B 模型欢迎大家继续来体验！资源荟萃人工智能	9	976	2024 年12 月 9 日
本地部署小模型用于翻译任务，qwen系列小模型表现横评，及个人电脑本地部署方案悬赏人工智能	32	572	2026 年3 月 29 日