OpenAI发布o1模型强化微调功能,未来是否可以用这个功能训练一个LINUXDO论坛万事通。目前看这个最大阻力是o1模型的昂贵价格
按照这个成本,估计只有始皇和VV佬可以上手
3 个赞
浪费的一批,想搞个万事通加点RAG就完了,完全不需要微调
2 个赞
但是我觉得这个的回答效果会非常好,用论坛数据进行强化学习
之前gpts不是也可以吗
不是一个级别的
还得喂数据 还得有结论和答案配合训练 太费劲了
应该不会这么复杂,因为o1模型本来就有一定的自主学习能力,openai应该会利用o1模型简化训练过程,让非程序员也能使用
简直是浪费。论坛里的东西RAG就足够了,又没难度,不需要它学会,哪里用得着微调啊
论坛的应用场景下它只需要找到对应的知识直接输出就行了。把一个o1不会的专业领域的知识做强化学习微调,o1能学会这些,自主做研究。专业领域的难度和深度才有强化学习的用武之地。论坛里的信息又杂又多又不深,微调效果还不一定有RAG效果好。靠rag足够了,微调就是高射炮打蚊子