kimi2.5进步了不少

mingyue_li · 2026 年1 月 28 日 03:59

国产模型又进步了，不知道智谱GLM5什么时候发布，到时候又是什么神仙段位
总之希望国产越来越好，大佬轻点喷

zhongruan · 2026 年1 月 28 日 04:03

5不是多模态，看起来，要等，估计在和华为联合训练

tom4to · 2026 年1 月 28 日 04:16

怎么这么多批皮小号，昨天晚上封了俩，今天又冒出来了

mingyue_li · 2026 年1 月 28 日 04:18

尴尬

jackliu100 · 2026 年1 月 28 日 04:19

我记得GLM当初不是说5要上多模态么？

zhongruan · 2026 年1 月 28 日 04:20

（运营说没听说5是多模态，我问了运营

jackliu100 · 2026 年1 月 28 日 04:20

他们创始人在X上说的，哈哈哈，那真不知道了

jackliu100 · 2026 年1 月 28 日 04:21

我说，怎么一堆吹的，而且尬吹，没事，任他吹，不好用就是不好用，没办法

NINE · 2026 年1 月 28 日 04:24

别看榜单看疗效

mingyue_li · 2026 年1 月 28 日 04:25

在用老黄的，先看效果

Microsoft · 2026 年1 月 28 日 04:25

等一个deepseek v4，说是编程能力很强，希望如此

lop · 2026 年1 月 28 日 04:26

封了吗？

Preston · 2026 年1 月 28 日 04:29

总榜15，coding第七，听说多模态不错，等多模态的视觉排名成绩，毕竟现在都在作弊或者跑分的情况下，benchmark也只能看看了，以竞技场大致参考（比如coding和hard prompts）。

另外还有个榜单不容易刷分就是长上下文那个contextarena.ai

MIKUSCAT · 2026 年1 月 28 日 04:30

coding没试过，看起来就是一般的水平
多模态和知识库还可以

wilsons · 2026 年1 月 28 日 04:30

看楼主的图，还以为第7名，严重怀疑有误导倾向。

Preston · 2026 年1 月 28 日 04:30

楼主点的coding排名排序，虽然给人感觉有点春秋笔法的感觉，但是也没啥太大问题

BHznJNs · 2026 年1 月 28 日 04:32

比 gemini3 flash 还强？真的假的

tom4to · 2026 年1 月 28 日 04:32

昨天晚上有个id是cfm*的，吹kimi，拉踩其他模型，号没了一个，换上小号又发了一条，又被封了

wilsons · 2026 年1 月 28 日 04:34

按coding

wooyang · 2026 年1 月 28 日 04:36

我也想发一篇，请问稿费哪里领取？

话题		回复	浏览量
Kimi2.5 最近网上吹的很火搞七捻三人工智能 , 软件开发	45	1432	2026 年1 月 30 日
Kimi有望成为国产code之光搞七捻三人工智能 , 纯水	68	1413	2026 年3 月 25 日
在实际需求从0到1用kimi k2.5有感开发调优人工智能	24	678	2026 年4 月 4 日
K2!真的好用么？什么水平啊❓ 搞七捻三人工智能 , 纯水	65	3423	2025 年7 月 19 日
glm4.7\|minimax 2.1正经大型项目需求分析能力国产替代人工智能	110	4027	2026 年1 月 8 日