Kimi K2的意义

刚刚看了个视频,是个我个人认为有点水平的老外(前Twitch工程师)讲为什么Kimi-K2那么重要。主要观点其实就一个:和DeepSeek-R1一样,模型开源,你可以生成出无穷无尽的数据来训练别的模型。DeepSeek-R1让思考模型遍地开花,Kimi-K2可以让其他模型的工具调用有巨大的进步。

我看站内也有佬测试了工具调用,感觉褒贬不一?不过看视频里他夸的是挺厉害的。不知道佬们有什么想法。我个人在Cherry Studio里面做一些需要调用工具的事情的时候,kimi调工具确实挺不错的。

(补充)作者观点如下

  • 现有模型(不管具体能力)能稳定靠谱的调用工具的,只有 Anthropic 和 OpenAI 的。
  • Gemini 喜欢说自己想要用什么,但是不调用
  • Grok 由于训练数据里有过多的 tool call,他喜欢调用他训练数据里的工具,而不是用户真的有的工具
  • DeepSeek 暂时还没赶上这个

但是,有 Kimi 之后,我们直接用 Kimi 就可以生成很多类似的优秀的 tool call 数据来训练别的模型。

36 个赞

等一个开发结果,官网的体验虽然不好,或许能靠大佬们加强完善整出新东西?

6 个赞

早半年出来配这套说法还差不多

6 个赞

支持kimi,国产之光 :heart_eyes:

3 个赞

理解代码比ds v3强点,别的没看出来

2 个赞

省流:一个基模

4 个赞

嗯,基座不错+开源,信创公司的最爱

3 个赞

能开源就很好了

1 个赞

开源模型迈入T量级参数了

纯小白很好奇,对于工具的调用这方面的训练难度有多大

不低呢。

3 个赞

难度很大

传统的llm训练,训练数据都是随便网上搞的,后面再加上一些代码数据

但是,针对工具调用优化的话,工具调用相关数据不是互联网上直接能搞到的,这就很难了。数据成本很高

6 个赞

kimi干得好啊 :+1:

站内喷kimi感觉已经是政治正确了,不管好坏都喷
这个不是思考模型,作为基模来说效果还说得过去,而且还开源

10 个赞

其实这就是这个视频里说的重要性。Kimi K2的tool call十分精准。作者观点如下

  • 现有模型(不管具体能力)能稳定靠谱的调用工具的,只有Anthropic和OpenAI的。
  • Gemini喜欢说自己想要用什么,但是不调用
  • Grok由于训练数据里有过多的tool call,他喜欢调用他训练数据里的工具,而不是用户真的有的工具
  • DeepSeek暂时还没赶上这个
    但是,现在我们有Kimi了,我们直接用Kimi就可以生成很多类似的优秀的tool call数据来训练别的模型。
11 个赞

让子弹飞一会儿

K2的指令遵循能力确实不错的,工具调用能力在开源模型里的确是最好的。

我感觉输出function call格式的难度不大,只是要数据
比如可以先找人写很多JSON格式的输出数据来做SFT
然后为了让输出json更标准,可以用RL来约束一下,比如json格式对了就有奖励,然后函数名字对了有奖励

不过如果是让agent决定什么时候调用什么工具的话可能有点难()?
需要一定智力。
比如之前gpt-3.5-turbo就可以function call,但是他不喜欢调用,除非提示词说的很明显
然后我之前做类似小爱同学的,用llm+mcp控制,发现glm-4-air容易对话多了不用工具,但是glm-4-plus就可以

1 个赞

问题是太慢了啊,十几个token/s
问一次问题要等一分多钟,这怎么玩

确实,我感觉调用工具在实际生产中确实很重要。Gemini用来写文字确实很好用,但是调用工具是依托,导致很难只凭借它来解决实际问题。