kimi2.5进步了不少

国产模型又进步了,不知道智谱GLM5什么时候发布,到时候又是什么神仙段位
总之希望国产越来越好,大佬轻点喷

28 个赞

5不是多模态,看起来,要等,估计在和华为联合训练

6 个赞

怎么这么多批皮小号,昨天晚上封了俩,今天又冒出来了

20 个赞

尴尬 :rofl:

1 个赞

我记得GLM当初不是说5要上多模态么?

4 个赞

(运营说没听说5是多模态,我问了运营

4 个赞

他们创始人在X上说的,哈哈哈,那真不知道了

5 个赞

我说,怎么一堆吹的,而且尬吹,没事,任他吹,不好用就是不好用,没办法 :rofl:

3 个赞

别看榜单 看疗效

1 个赞

在用老黄的,先看效果

2 个赞

等一个deepseek v4,说是编程能力很强,希望如此

1 个赞

封了吗?

总榜15,coding第七,听说多模态不错,等多模态的视觉排名成绩,毕竟现在都在作弊或者跑分的情况下,benchmark也只能看看了,以竞技场大致参考(比如coding和hard prompts)。

另外还有个榜单不容易刷分就是长上下文那个contextarena.ai

1 个赞

coding没试过,看起来就是一般的水平
多模态和知识库还可以

LMArena Leaderboard | Compare & Benchmark the Best Frontier AI Models 真相是

看楼主的图,还以为第7名,严重怀疑有误导倾向。

3 个赞

楼主点的coding排名排序,虽然给人感觉有点春秋笔法的感觉,但是也没啥太大问题

2 个赞

比 gemini3 flash 还强?真的假的

昨天晚上有个id是cfm*的,吹kimi,拉踩其他模型,号没了一个,换上小号又发了一条,又被封了

4 个赞

按coding

1 个赞

我也想发一篇,请问稿费哪里领取?

1 个赞