如何微调一个开源模型?

最近接触到的微调方案都是基于某个平台提出来的微调方案。比如 OpenAI 微调

但是我有些好奇,OpenAI 是怎么怎么将用户传递的数据进行微调的?是有什么技术方案么?有什么这方面的帖子么?求各位大佬推荐

5 个赞

几个开源模型微调的文档:

https://qwen.readthedocs.io/en/latest/training/SFT/llama_factory.html

另参见:

5 个赞

mark了,吃灰吧

蹲一手,看看有没有大佬出中文教程=。=

感谢大佬分享

除非你有足够的数据,可能回答会专业点,小模型真的不咋样

最近被安排了个任务,微调大模型,折腾了好久。
用的llama-factory,llama3.1-8b,微调完以后用ollama加载大模型,open-webui对话。

单纯的微调很简单,网上随便找找教程就好了。
难的是数据集怎么来的,数据集还要保证高质量。

我被安排的是,根据公司的gitbook提炼出qa问题,然后进行训练。
qa问题我是用gpt-4o和gpt-4 提炼的,但是也惨不忍睹。。

训练完都是有点傻傻的,如果搜不到他就会乱讲一通。

大佬有教程吗?我也想微调玩玩。

这个必须收藏了。

确实是这样子的。数据集的搜集才是最难受的过程

mark,等大佬出中文文档 :upside_down_face:

mark!模型微调