对各个ai目前的印象和使用体验以及闲谈

以下皆是个人主观观点,如果有错欢迎佬友们纠正

gpt 先发者,知道的人最多,但随着开发人员出走,变得疲软。体验评价是理论知识最多,可以用来做数学题,代码上 codex纠错非常强,但最开始说要求的时候,代码生成质量比不上克

claude 代码和文笔代表,虽然之前文笔大砍了一刀,opus仍然是顶端(gemini可以平替),代码上面可以说是你给他要求,他开始代码会写的最好,但容易做你没要求的事情,画蛇添足,并且特别喜欢创建很多文件,代码会有小bug,建议用codex纠错,我的做法是先提要求,让他生成,然后用codex修bug

gemini 多模态之王,识图识别视频等等都是最好的(而且可以翻译本子 雾),其他方面什么都能做到良好,但很难达到顶尖,最大的优点是谷歌家大业大,可以在ai studio免费用 。代码基本上不会用它,就是勉强能跑,但很粗糙的感觉,容易爆各种各样的错误

grok 一直很拉,但日常使用,搜索是真的卖力,一个问题可以搜索100个网页 100个x帖子

deepseek 开源的王,真要说量大管饱只能是他,因为开源,各种渠道都有,而且免费的非常多,并且水平至少在平均以上,可以说非常容易爽用

以上是一直使用以来的感受,然后是一个小闲聊的点,就是关于吹捧某家ai是最强的,因为一个ai在某个方面最好,然后日常使用最多的就是这个方面,导致感觉什么都能做到,感官积累,就过度神话了,实际上各个ai都有不擅长的地方,多用,多尝试,问题一个ai解决不了试试用另一个,这才是ai使用ai最好的方法

6 个赞

目前付费购买了chatgpt和claude

其实codex写代码真的很强,opus4.5还差他一截,codex最大的问题是gpt5.2的格式很烂,经常容易出现格式化问题

1 个赞

非码农,但是工作大量使用ai,这几家模型给我的感觉是
claude最听话也最听得懂人话,所以我非常喜欢,即使反重力把4.5o调教到逆天两次对话就看不到上下文,这也是最遵守指令的。
Gemini和gpt喜欢我行我素,只在意我要求的“结果”,中间部分是看心情按我说得来,这里面Gemini经常超常发挥,gpt闭着眼都能猜到怎么实现,但是Gemini也经常对“结果”自我发挥
国产ai方面
mm2.1听话了就智力低下,智力上线了就不听话……
glm不评价,我的使用体验很糟糕,感觉它在使唤我而不是我使唤它
ds3.2平衡的不错,但是喜欢在自己的幻觉上不停重复,我不能让它做大段的长任务
k2听话并且在不同领域有非常明显的断档表现,简称时神时鬼,所以用它有点像开盲盒
豆包不说了,开了火山plan后我认为,字节给这个plan提供同等额度的v3.2是明智之举,否则大伙会全部提交工单,要求9.9退费

1 个赞

codex写后端很强就是太慢,opus快还好,gemini写个前端得了。其他的不做评价 :distorted_face:

代码方面还是claude好

gpt 用起来感觉模型知识经验没有那么重量级,但似乎思维链用到了非常多魔法,意外能处理很多复杂问题。

gemini 就是另一个极端,知识面广,傻快傻快的

codex除了说人话的时候也不太像人话还有慢了点之王没什么缺点

确实,谁好使就用谁!

grok搜索x上的内容还是很强的,做客户调研啥的很啊后