Artificial Analysis网站已发布 Claude 4 Sonnet 与 Gemini 2.5 Pro 预览版的比较






Opus





source: https://artificialanalysis.ai/models/comparisons/claude-4-sonnet-vs-gemini-2-5-pro

9 个赞

拼尽全力亦是无法战胜吗?哈基米你这家伙这么强是要干嘛!

12 个赞

是sonnet,不是opus

一看就知道是0325,0325早似了

1 个赞

什么,收费的干不过免费的?

opus也打不过。。。

哈基mini这么强的么?!看上去好像全方面压到Claude 4.0 Sonnet?或者说评分网站只是看个笑,具体得落实具体操作

只存在于过去的模型(

看到Gemini 这么强,心满意足地离开

1 个赞

Gemini推理、科学计算都很强,再加庞大的数据集,Claude就一编码,

2 个赞

又强又便宜,谁不爱呢

看来和3.7 sonnet没有质的变化,claude平时我只用来cursor写些简单代码,复杂的代码或者问题还得是哈基米和o3

2 个赞

这是0325,现在这个0520是路边一条

4 个赞

有变化,4比3.7生成的css样式要花里胡哨一点

还能用上这么强的Gemini吗 :tieba_087:

遥遥领先

之前gpt3.5出来的时候我就觉得,AI大战谷歌一定是最强的那一档,要数据有数据,要:money_bag::money_bag:,只要不犯路线错误,根本输不了,但是AI确实是动了搜索广告的蛋糕,不过目前看谷歌还是很有魄力的,像Anthropic这种初创小厂,还派头不小,迟早倒闭(之前最爱用的AI Claude,现在眼看着逐步落后了,CEO还贼能BB)

2 个赞

这个网站我记得是路边,反正我记得我早屏蔽这个网站了,给出来的评分和实际体验差很多。尤其是llama出新模型那会,就他给了个很高分,那条推底下都是喷他的。

A社的问题是给自己加太多戏了,能力还是不错的,但极度傲慢,不改一改的话确实早晚把自己玩死

未来感觉是顶级模型依然由传统互联网巨头垄断,其他公司(这里包括OpenAI)要么走向开源,要么走向死亡

opus4 这么贵,结果就这?