公司搞到硬件了，接下来又好像打算训练或者微调大模型了，下午就要写个训练方案，怎么才能既专业又能让他们死心？

mistpeak · 2025 年5 月 30 日 03:23

起因是公司搞到硬件了，说是要跟某个算力中心合作，接下来又好像打算训练或者微调大模型了，要写个训练方案，怎么才能既专业又能让他们死心？
说实话我还没实际训练过，有现成的框架么？最容易上手那种。
怎么写才能既专业，又能让他们死心？
训练和微调，有些时候其实没那么大的优势，尤其是我们公司现在搞的也都是关于一些专业内容的生成，直接RAG精确的反而更高
咋搞？下午就要出大纲

clear123 · 2025 年5 月 30 日 03:33

Verl 框架好上手，文档很详细

mistpeak · 2025 年5 月 30 日 03:35

感谢佬，我看一下，实在是没打过富裕的仗

wanzimei · 2025 年5 月 30 日 03:36

搞到什么硬件了多少显存，想训练微调啥模型

mistpeak · 2025 年5 月 30 日 03:37

佬你猜我为啥想让他们死心，就是因为啥也不知道，然后只知道对方有一堆显卡，这怎么搞，

mistpeak · 2025 年5 月 30 日 03:38

模型的话，也没选，估计是打算让我来选，这能选啥，deepseek，qwen好了

normandy · 2025 年5 月 30 日 03:39

别怕训练其实不难，做好预期管理就行了，关键就是让领导知道要达到什么效果至少要多少算力，也就是多少成本

mistpeak · 2025 年5 月 30 日 03:39

其实我觉得就应该体现一个人绝对不够的情况，这东西我不想一个人承担结果

ray521980 · 2025 年5 月 30 日 03:41

天呐世另我，让我一个Java全栈开发带着几个人对着十几张 910B 折腾了半年

RichardChou · 2025 年5 月 30 日 03:42

搞这东西目的是什么呢

Lin_Xiao · 2025 年5 月 30 日 03:45

LLaMA-Factory 值得拥有

stevessr · 2025 年5 月 30 日 03:47

kaggle¿
~~老旧算力过剩¿~~

mistpeak · 2025 年5 月 30 日 03:48

我找到这个了，刚找到

Lin_Xiao · 2025 年5 月 30 日 03:48

框架只是最基础的，微调还是数据和训练方法和偏好才是重头和难点。。

ronronlai · 2025 年5 月 30 日 03:55

直接SFT，llamfactory+Lora，全图形化操作，效果不比复杂的框架差，主要是数据集的质量加个dsr1-qwen3-0528,起飞。

mistpeak · 2025 年5 月 30 日 03:55

对，所以我觉得这事情不靠谱，可能有些时候，不明确，训练微调搞出来的，还没直接RAG来的效果好

mistpeak · 2025 年5 月 30 日 03:56

好的佬，图形化就很银兴化了

jxjz · 2025 年5 月 30 日 05:11

有多少训练数据？

jinchengwu · 2025 年5 月 30 日 07:08

进展咋样啦？

user46 · 2025 年5 月 30 日 07:17

我理解的是得有数据才好训练，得人工打标之类的吧？

话题		回复	浏览量
如何训练公司特有的大模型？搞七捻三人工智能 , 快问快答	33	691	2025 年3 月 24 日
佬友们，我主职java，但领导要求搞模型，要从哪学起啊？（已解决）开发调优快问快答	50	1092	2025 年2 月 1 日
【吐槽】大模型太强了，以至于很多人感觉自己行了开发调优人工智能 , 软件开发 , 纯水	255	7078	2026 年3 月 20 日
qwen2.5-vl-72b-instruct微调搞七捻三人工智能	22	559	2025 年3 月 21 日
机器学习太难了搞七捻三人工智能 , 快问快答	20	536	2024 年12 月 9 日

公司搞到硬件了，接下来又好像打算训练或者微调大模型了，下午就要写个训练方案，怎么才能既专业又能让他们死心？

相关话题