各AI大模型在编程上的效果差距,实测效果展示。可供大家参考选择自己使用哪种模型

刚刚看到这个帖子

于是做了下面这些测试,双模型并排盲测,投票选择认为web开发效果更好的模型,测试网址:https://web.lmarena.ai ,盲测选题是:做一个博客登录页











2 个赞

谢谢分享!请问这是什么软件呀?

同求!!

应该是这个https://web.lmarena.ai/

谢谢大佬!

太强了,大佬!

从实测来看,Claude在编码这一块还是依旧强无敌,感觉o3-mini的这个10分领先有水分啊

1 个赞

搞不好是作弊了

2 个赞

反正我个人最近是吧写脚本的工作都交给o3-mini-high了,个人感觉一次成功的概率比之前用claude高

1 个赞

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。