如何微调一个开源模型？

thmu · 2024 年9 月 27 日 08:23

最近接触到的微调方案都是基于某个平台提出来的微调方案。比如 OpenAI 微调

但是我有些好奇，OpenAI 是怎么怎么将用户传递的数据进行微调的？是有什么技术方案么？有什么这方面的帖子么？求各位大佬推荐

Scheme_Matrix · 2024 年9 月 27 日 08:38

几个开源模型微调的文档：

另参见：

WIlson · 2024 年9 月 27 日 08:40

mark了，吃灰吧

kuschzzp · 2024 年9 月 27 日 08:41

蹲一手，看看有没有大佬出中文教程=。=

thmu · 2024 年9 月 27 日 08:46

感谢大佬分享

xinmodevil · 2024 年9 月 27 日 09:59

除非你有足够的数据，可能回答会专业点，小模型真的不咋样

parklot · 2024 年9 月 27 日 10:18

最近被安排了个任务，微调大模型，折腾了好久。
用的llama-factory，llama3.1-8b，微调完以后用ollama加载大模型，open-webui对话。

单纯的微调很简单，网上随便找找教程就好了。
难的是数据集怎么来的，数据集还要保证高质量。

我被安排的是，根据公司的gitbook提炼出qa问题，然后进行训练。
qa问题我是用gpt-4o和gpt-4 提炼的，但是也惨不忍睹。。

训练完都是有点傻傻的，如果搜不到他就会乱讲一通。

huihuang · 2024 年9 月 27 日 11:43

大佬有教程吗？我也想微调玩玩。

BreathFree · 2024 年9 月 27 日 11:56

这个必须收藏了。

thmu · 2024 年9 月 29 日 06:44

确实是这样子的。数据集的搜集才是最难受的过程

rstyro · 2024 年9 月 29 日 07:48

mark,等大佬出中文文档

ukhack · 2024 年9 月 29 日 08:18

mark!模型微调

话题		回复	浏览量
模型微调，有啥实践路径开发调优人工智能 , 快问快答	6	247	2025 年12 月 1 日
新人想学习大模型微调开发调优人工智能 , 快问快答	12	610	2025 年3 月 19 日
大模型微调or训练教程(LLaMA-Factory) 开发调优教程 , 人工智能 , 快问快答	39	1253	2025 年2 月 19 日
做一款AI的APP，调用市面上的AI大模型，然后针对性的做一些微调和训练，这种微调和训练如何做？开发调优人工智能	25	377	2025 年8 月 11 日
学习：如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下开发调优 ChatGPT , OpenAI , 人工智能 , 快问快答 , 软件开发	15	456	2025 年10 月 30 日