最近接触到的微调方案都是基于某个平台提出来的微调方案。比如 OpenAI 微调
但是我有些好奇,OpenAI 是怎么怎么将用户传递的数据进行微调的?是有什么技术方案么?有什么这方面的帖子么?求各位大佬推荐
最近接触到的微调方案都是基于某个平台提出来的微调方案。比如 OpenAI 微调
但是我有些好奇,OpenAI 是怎么怎么将用户传递的数据进行微调的?是有什么技术方案么?有什么这方面的帖子么?求各位大佬推荐
几个开源模型微调的文档:
另参见:
mark了,吃灰吧
蹲一手,看看有没有大佬出中文教程=。=
感谢大佬分享
除非你有足够的数据,可能回答会专业点,小模型真的不咋样
最近被安排了个任务,微调大模型,折腾了好久。
用的llama-factory,llama3.1-8b,微调完以后用ollama加载大模型,open-webui对话。
单纯的微调很简单,网上随便找找教程就好了。
难的是数据集怎么来的,数据集还要保证高质量。
我被安排的是,根据公司的gitbook提炼出qa问题,然后进行训练。
qa问题我是用gpt-4o和gpt-4 提炼的,但是也惨不忍睹。。
训练完都是有点傻傻的,如果搜不到他就会乱讲一通。
大佬有教程吗?我也想微调玩玩。
这个必须收藏了。
确实是这样子的。数据集的搜集才是最难受的过程
mark,等大佬出中文文档 ![]()
mark!模型微调