自claude-3-5-sonnet发布以来,在编程领域近半年时间一直排行在前列,
无论是排行榜(个人认为LLM Arena的Coding/LiveBenchi的排行榜没有那么准确,此排行榜准确度高),还是自己或者是同行的使用体验来看,Claude一直是写代码最好用的ai大模型,
无论是Gemini 2.0的thinking模型、Deep Seek R1、closeAi的01-mini,preview,o1,pro,o3-mini,都是无法比拟的,实际编程效果、体验都不如claude-3-5-sonnet(较于R1、o1、o3可识图,虽然Gemini 2.0全系模型、4o也识图,但呈现的效果精细程度不如Claude完美)。
请问有没有懂深度学习技术的大佬解释分析一下Claude编程的底层逻辑?与其他模型的不同点在哪里?未来是否会有比Claude更利于编程的模型?
2 个赞
对齐做得好?我也不理解,希望大佬解释一下
@Jason_ghost
首先我觉得Claude 3.5 Sonnet的模型幻觉低很多
这样可以保证大模型生成信息的准确性
也就是不乱写代码
这样就保证了代码的精确度
大幅度减少了出现bug的可能性
也自然就领先了
2 个赞
我记得他们 ceo有次采访说模型的能力体验受风格影响很大,他们调教的这个风格符合大众的理解,还有 3.5 是被他们内部的推理模型蒸馏过的,貌似有更大的推理模型在内部使用。而且目标单一,和 deepseek 差不多,很聚焦。谷歌和 closeai 都玩的花,搞什么视频模型。
1 个赞
理解能力强,状态很稳,准确率在8-9之间,基本上他答不上来的其他模型也会答错.
此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。


