kimi-k2.5有点猛啊,搜索能力上这波直追gpt-5.2-pro


对比看来感觉qwen3-max-thinking完全是走错了路子
比成本比不过deepseek、1T参数,结果比知识量也比不过gemini
然后又没有多模态……
各方面都很平庸,就导致这个模型完全找不到应用场景(反正我是没找到)
个人观点:后续模型发展会越来越分化,大而美一模通吃的时代结束了,各家厂商都得想办法找自己的落地场景,不止是应用落地,而是在模型训练阶段就要想好这个模型炼出来干什么
我感觉通义这波应该是踩坑了,这个模型调用量可能不会多好看
各个山头都被占领了,低成本deepseek凭借DSA遥遥领先,671B的模型1M输入才2¥……这怎么比?编程方面minimax、glm都在发光发热,再往上还有Opus和Codex、Gemini三座大山

50 个赞

我感觉国产未来,DEEPSEEK\GLM\M2系列还行,其他的看把,KIMI反正很多时候用起来不如豆包(非编程),编程场景KIMI属于完全没法用,指令遵循巨差,属于开头就开始差,GLM4.7再怎么样人家能完整跑完,KIMI我每次测试都跑不完,K2.5我昨天试了一下,一样的 :rofl: 真的崩溃,不过起码有多模态了

31 个赞

就这样,qwen3-max 还不是开源的,而且还好意思说自己有希望迈入万亿 tokens 门槛

8 个赞

我只能说KIMI K2.5属于给国产开了个好头 ,未来估计还是被献祭的主,上次K2 THINKING发布也是论坛好多人好厉害,好牛逼,这波国产厉害了,然后呢?2个月了提都没几个提,用就更没人用了,日常讨论最多还是GLM4.7 + M2.1,为啥?因为不好用啊,一用一个不吱声

21 个赞

:rofl: 跟GEMINI 3比上下文,跟QWEN3比好用,属于欺负傻子和欺负智障 :rofl:

16 个赞

有体面一点的赢法么 每日一赢 :tieba_095:

9 个赞

开始发力宣传了,但是市场会教育企业,不好用就是不好用,就像QWEN3一样,阿里再怎么宣传,不好用还是不好用

23 个赞

每次出来都是爆杀,结果没长期用过:rofl:

5 个赞

次次SOTA,次次被献祭的主 :rofl:

8 个赞

内建搜索能力了吗?不太用国产模型API就是因为没有内建搜索。

3 个赞

狼来了属于是

3 个赞

有你也不会想用的,百度作为国内搜索引擎top1,你用的多吗

4 个赞

开源模型,有没有内建搜索反而不重要吧?内建搜索可能质量反而不太行,我一般配合CherryStudio搭配tavily使用

5 个赞

:tieba_004: 这能说明啥这个

2 个赞

也有道理

1 个赞

啊,搜索能力这么强吗

千问的广告打的是负效果,B站我看个视频都一堆商单,纯忽悠小白的

9 个赞

搜索能力确实有提升,之前搜索结果会弹出来然后很慢,现在把搜索结果给隐藏,给人的体感会好很多,之前有种搜索+总结结果 不像大模型

对极了QQ

我也是这个感觉,kimi这家公司从gpt4时代开始出来宣传的就是秒杀gpt4,然后每次发布新模型都投一堆广告次次都是秒杀当时的sota模型,然后我应该在k2的时候信了某些测评充值了测了一下发现不是那么回事..后来就没有再继续充值过,除了之前0.99活动时又冲了一个月体验了下发现也和宣传能力有出入..这次又是熟悉的秒杀gpt5.2和opus,只能说宣传有点夸大..

7 个赞