最近o3 和o4mini 出来,和gemini2.5pro相比谁的编程代码能力更胜一筹?
6 个赞
o3 o4mini 在编程这个领域上感觉还是不如 4.1,思考模型不适合拿来编程
1 个赞
编码最强应该是3.7了
2 个赞
claude仍然是老大,你多写点对比就发现了
2 个赞
还是喜欢用克劳德,gemini2.5也不错
2 个赞
当然是3.7
1 个赞
gemini2.5就是首字有点慢,不然我觉得真不输claude,claude现在有点降智的感觉
2 个赞
是吗?思考模型不适合编程吗?我一直用3.7think,回头试试3.7
用cursor默认Claude 3.7 sonnet最强了
编程也得分写项目和搞算法。要是真要写一个几千行以上的项目的话,还得是Claude。
我开始转gemini 2.5 pro了 ,慢一点但是全能
思考模型狗头军师,可以策划框架,不了解的地方直接让他起手比基础模型强的多,但具体实现没有优势,指令依从性差还墨迹。
1 个赞
claude
Claude。
Gemini 2.5 pro 次之。
GPT 编程就是辣鸡。
原来如此,受教了
1 个赞
Claude唯一的问题是太自大了,经常自作主张改动没让他改的地方
Claude 3.7
可以参考aider的排行榜 Aider LLM Leaderboards | aider
工具对比可以参考 https://www.swebench.com
Claude3.7,没有之一。各大模型我用起来最舒服的是Claude。之前试着给一个报告的模板,让ai根据要求填写,claude输出的最完整,Grok和gemini2.5pro生成的不全(让你自己续写,顺带着嘲讽你一番)
1 个赞
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。