Kimi K2的意义

Debris · 2025 年7 月 13 日 13:16

刚刚看了个视频，是个我个人认为有点水平的老外（前Twitch工程师）讲为什么Kimi-K2那么重要。主要观点其实就一个：和DeepSeek-R1一样，模型开源，你可以生成出无穷无尽的数据来训练别的模型。DeepSeek-R1让思考模型遍地开花，Kimi-K2可以让其他模型的工具调用有巨大的进步。

我看站内也有佬测试了工具调用，感觉褒贬不一？不过看视频里他夸的是挺厉害的。不知道佬们有什么想法。我个人在Cherry Studio里面做一些需要调用工具的事情的时候，kimi调工具确实挺不错的。

（补充）作者观点如下

现有模型（不管具体能力）能稳定靠谱的调用工具的，只有 Anthropic 和 OpenAI 的。
Gemini 喜欢说自己想要用什么，但是不调用
Grok 由于训练数据里有过多的 tool call，他喜欢调用他训练数据里的工具，而不是用户真的有的工具
DeepSeek 暂时还没赶上这个

但是，有 Kimi 之后，我们直接用 Kimi 就可以生成很多类似的优秀的 tool call 数据来训练别的模型。

crystals201 · 2025 年7 月 13 日 13:25

等一个开发结果，官网的体验虽然不好，或许能靠大佬们加强完善整出新东西？

scooter · 2025 年7 月 13 日 13:25

早半年出来配这套说法还差不多

Myallure · 2025 年7 月 13 日 13:29

支持kimi，国产之光

outgoing · 2025 年7 月 13 日 13:31

理解代码比ds v3强点，别的没看出来

stevessr · 2025 年7 月 13 日 13:31

省流：一个基模

epictus · 2025 年7 月 13 日 13:31

嗯，基座不错+开源，信创公司的最爱

BlakeHansen130 · 2025 年7 月 13 日 13:32

能开源就很好了

fengchris · 2025 年7 月 13 日 13:32

开源模型迈入T量级参数了

Myallure · 2025 年7 月 13 日 13:34

纯小白很好奇，对于工具的调用这方面的训练难度有多大

hanlinwenyuan · 2025 年7 月 13 日 13:37

不低呢。

jcc · 2025 年7 月 13 日 13:44

难度很大

传统的llm训练，训练数据都是随便网上搞的，后面再加上一些代码数据

但是，针对工具调用优化的话，工具调用相关数据不是互联网上直接能搞到的，这就很难了。数据成本很高

Myallure · 2025 年7 月 13 日 13:45

kimi干得好啊

yefori · 2025 年7 月 13 日 13:49

站内喷kimi感觉已经是政治正确了，不管好坏都喷
这个不是思考模型，作为基模来说效果还说得过去，而且还开源

Debris · 2025 年7 月 13 日 13:49

其实这就是这个视频里说的重要性。Kimi K2的tool call十分精准。作者观点如下

现有模型（不管具体能力）能稳定靠谱的调用工具的，只有Anthropic和OpenAI的。
Gemini喜欢说自己想要用什么，但是不调用
Grok由于训练数据里有过多的tool call，他喜欢调用他训练数据里的工具，而不是用户真的有的工具
DeepSeek暂时还没赶上这个
但是，现在我们有Kimi了，我们直接用Kimi就可以生成很多类似的优秀的tool call数据来训练别的模型。

edinik · 2025 年7 月 13 日 13:54

让子弹飞一会儿

3GZ · 2025 年7 月 13 日 14:32

K2的指令遵循能力确实不错的，工具调用能力在开源模型里的确是最好的。

xy3 · 2025 年7 月 13 日 14:35

我感觉输出function call格式的难度不大，只是要数据
比如可以先找人写很多JSON格式的输出数据来做SFT
然后为了让输出json更标准，可以用RL来约束一下，比如json格式对了就有奖励，然后函数名字对了有奖励

不过如果是让agent决定什么时候调用什么工具的话可能有点难（）？
需要一定智力。
比如之前gpt-3.5-turbo就可以function call，但是他不喜欢调用，除非提示词说的很明显
然后我之前做类似小爱同学的，用llm+mcp控制，发现glm-4-air容易对话多了不用工具，但是glm-4-plus就可以

txu8459 · 2025 年7 月 13 日 14:35

问题是太慢了啊，十几个token/s
问一次问题要等一分多钟，这怎么玩

user997 · 2025 年7 月 13 日 14:36

确实，我感觉调用工具在实际生产中确实很重要。Gemini用来写文字确实很好用，但是调用工具是依托，导致很难只凭借它来解决实际问题。

话题		回复	浏览量
怎么感觉大家的Kimi K2和我的不一样❓ 开发调优人工智能	137	2620	2025 年7 月 17 日
K2!真的好用么？什么水平啊❓ 搞七捻三人工智能 , 纯水	65	3423	2025 年7 月 19 日
Kimi K2 0905 [ 正式发布 ] 编码性能提升！前沿快讯人工智能 , Cursor	98	3399	2025 年10 月 21 日
kimi2.5进步了不少国产替代人工智能	89	3885	2026 年1 月 31 日
2025 年 AI Agent 的最佳大模型基座！kimi k2 之于 AI Agent 开发的简单测评开发调优 ChatGPT , OpenAI , 人工智能 , 软件开发 , Cursor	76	2987	2025 年7 月 23 日

Kimi K2的意义

相关话题