竞技场谷歌的新模型简单测评

输入的要求相同:
Design a concept poster for a new mobile phone.


qwen-max-2025-01-25

gpt-4.1-mini-2025-04-14

gemini-2.0-flash-thinking-01-21

claybrook

gemini-2.5-flash-preview-04-17

claude-3-7-sonnet-20250219

llama-4-maverick-17b-128e-instruct

o3-mini-2025-01-31

dayhush

dayhush和claybrook是最近新出现在竞技场的模型,我个人感觉是同一个模型,但是提示词不同,因为两个模型出的东西风格十分类似,问一下也能问出来是谷歌的模型,有兴趣的可以试一下,竞技场刷到的概率特别大
上面的测试可以看到和claude3.7有一拼,而且多试了几个,dayhush出的ui都很好看,风格很相同


竞技场链接
http://web.lmarena.ai/

17 个赞

应该就是谷歌说的专门为编程特化的模型,好像是今天公布?

12 个赞

这个多少钱

4 个赞

有意思,期待ing

4 个赞

ultra?

4 个赞

可能是哦,这样的话我反而能理解gemini2.5pro最近的表现是怎么回事了

3 个赞

我来看看

2 个赞

Google最近也太勤

2 个赞

谷歌太强了 :tieba_087:

2 个赞

Google 雄起!

2 个赞

真是谷歌的 有点强啊

这样的话我反而能理解最近2.5Pro的表现是是什么情况了,原来是在准备发新模型 :bili_038:

2 个赞

期待谷歌!

我就佩服一点,4:25还在测试大模型的人,是真的不用睡觉吗?

期待厂家们继续卷,最好把价格也卷下来。

实际上3点就开始测试了()

是不是打错网址了 :tieba_087:

是web,感谢提醒:rofl:

竞技场怎么用特定的模型聊, 我这好像没看到选择模型选项

我也没有看到