如何训练公司特有的大模型？

libaimu · 2025 年2 月 21 日 09:00

如题，最近公司也想把业务跟ai结合起来，训练自己的大模型，网上看了一圈的资料，说说自己的理解，不知道对不对，还请各位佬指点指点，严格意义上来说，大模型自开放出来后，其实训练也就结束了，也就是模型的参数已经确定了，不会再改变了，后期不论跟他对话多少次，他的模型参数也不会再变，所以不存在训练一说，公司想要做自己业务的大模型，无非也是就是通过rap挂载公司自己的业务文档，然后通过调整prompt来实现特有模型的“训练”，请问这样的理解对吗，还有其他什么方式可以来“训练”大模型吗？

fakepan · 2025 年2 月 21 日 09:02

可以微调，用于特定的领域和用途，也可以预训练，从最开始的环节就加入相关的知识；还有续训练，工作量稍微少些

zilanlann · 2025 年2 月 21 日 09:04

一般rag或者lora微调，推荐做rag，不过rag也是深坑。可以看看各大厂技术公众号，他们做了不少相关实践

yangtb2024 · 2025 年2 月 21 日 09:04

rag和微调吧

leowyzhang · 2025 年2 月 21 日 09:06

小公司就微调吧

libaimu · 2025 年2 月 21 日 09:06

微调是不是还要大模型的研发能力？公司目前没有这种能力啊

fykang · 2025 年2 月 21 日 09:11

有微调框架，可以去了解一下
unsloth 模型微调框架
huggingface 模型技术平台（可以理解成专门做大模型的 github）

libaimu · 2025 年2 月 21 日 09:17

感谢各位佬的回复，目前看应该就微调跟rag两种方式了，我先去研究研究

hwang · 2025 年2 月 21 日 09:18

技术能力一般的话就RAG 吧，搭个fastGpt 就可以开工了

zpmljzzc · 2025 年2 月 21 日 09:18

对，但问题是得被授权后才能商用，至于公司自己可以用不可以用，我觉得如果不授权的情况，看看别人追究不
可以预训练，可以微调，甚至知识库可以自己增加，最好选个好参数的，我觉得企业至少70B吧

jxjz · 2025 年2 月 21 日 09:19

微调，自己需要整理数据。还是RAG+prompt好些。不要求时间就玩工作流那一套

zpmljzzc · 2025 年2 月 21 日 09:19

rag好难用，尤其embedding不好的话，反正我没有用好过，sigh

jxjz · 2025 年2 月 21 日 09:20

我也觉得是，其他小参数的最多跟你对个话

jxjz · 2025 年2 月 21 日 09:20

确实召唤准确性对于我来说难搞

shehuiwu · 2025 年2 月 21 日 09:23

领导拍脑袋，底下跑断腿

zpmljzzc · 2025 年2 月 21 日 09:30

DIFY么，我刚装完，感觉这个玩意挺有意思

fakepan · 2025 年2 月 21 日 09:31

可以看下开源协议，很多开源基座都能商用，在一定的规模以下没问题的，太大了才需要跟他们聊

jxjz · 2025 年2 月 21 日 09:31

我也装过，我用的fastgpt

zpmljzzc · 2025 年2 月 21 日 09:31

我这个是笔记本电脑，真不配玩大模型。8G显存，画图的话就能玩玩pony，如果大语言模型，就能玩玩7B的，惨兮兮。

jxjz · 2025 年2 月 21 日 09:32

确实，而且参数要调低才能用

话题		回复	浏览量
话说各位佬你们微调模型吗搞七捻三人工智能 , 快问快答	20	486	2025 年2 月 9 日
公司搞到硬件了，接下来又好像打算训练或者微调大模型了，下午就要写个训练方案，怎么才能既专业又能让他们死心？开发调优人工智能	37	1144	2025 年6 月 29 日
大模型微调or训练教程(LLaMA-Factory) 开发调优教程 , 人工智能 , 快问快答	39	1252	2025 年2 月 19 日
佬友们，如何将企业自己的代码喂给大模型，然后再使用编辑器去基于投喂过代码的模型去生成代码呢，有什么好的方案吗开发调优人工智能 , 快问快答	20	603	2025 年10 月 31 日
佬友们，我主职java，但领导要求搞模型，要从哪学起啊？（已解决）开发调优快问快答	50	1092	2025 年2 月 1 日

如何训练公司特有的大模型？

相关话题