目前感觉 Claude 4 诚意不足,感觉会被 DeepSeek 干死

Claude 4 目前个人简单使用了一下,没有感到任何惊艳之处,甚至不觉得有较大的进步。
对比谷歌 Gemini 2.0 到 2.5 的进步,简直就是就是微不足道。

如果 Anthropic 手上已经没有存货的话,那么这公司我感觉是第一个被 DeepSeek 或 其它什么开源给直接干死的。

DeepSeek 只要 v4 能力能接近或达到 Claude sonnet 3.7 的水平,即使总体能力不如 Claude 4,Claude 可以说基本没有什么机会了。

个人一点愚见。

18 个赞

这也解释了为啥之前它家拼命游说要封杀ds等中国AI了,连造谣都使上了。
但应该不会死,还是被它游说成功了,可恶。
按照美国最新AI管制规则,后面DS新出的模型很可能无法在美国芯片上推理,那等于无法在国外部署了。

9 个赞

这个,Claude4,大体满意吧,我注意到一些奇怪的用法,(依旧额度抠门就是了)…
不放开额度,很难说有体验上的改善…
反正快6月,7月了,很很期待一波就是了。DeepSeek,再来次华丽的出场吧 :smiling_face_with_three_hearts:

2 个赞

DeepSeek V3 0324 感觉确实已经能快比肩 Claude-3.5-Sonnet 了,V4 应该会很亮眼,确实可能直接一发布就把 Claude 比下去

3 个赞

ai性能高低一直都是事实说话,gemini当年演示视频造假时,你能想象到现在05-06的统治力吗

11 个赞

如果只看聊天编码确实和某些模型差不多
但claude的tool calling能力目前还是一骑绝尘。和deepseek,gpt和gemini都有很大差距。

这应该也是claude不降价的底气

(当然我并不是支持claude这样的定价,我现在巴不得deepseek或者其他什么人出一个tool calling的版本把agent的价格打下来)

2 个赞

?? :sweat_smile:

2 个赞

主要是太贵了

2 个赞

赶紧出R2和V4,那群人天天说CN威胁论,这下得来真的了 :rofl:
搅局!!!卷卷卷!!!
对我们的好处就是更多大撒币羊毛可薅!

4 个赞

claude和deepseek就不是一个赛道的,日用的claude又贵又难保号能力也不是最强,claude强的是编程。

赞同啊 claude的工具调用能力确实牛批 基本都能调用 其他的模型达不到这个水平

好像又改了规则,一开始确实是说禁止中国模型用于美国芯片,现在好像改成类似于警告风险什么的了。

主要Deepseek Qwen这些模型还是开源第一梯队,想不用也不行()

1 个赞

主要还是2.5之前的模型都太弱了

其实主要是claude本身就是御三家里最弱的。出去claude3.5的惊艳之外,其他时期的产品都打不过gpt。
openai是坏,但绝不菜。不然今年怎么发了这么多模型

1 个赞

并不是,gemini2.0的产品能力已经很可以了

1 个赞

感觉一般,测试了一下,几个模型中唯一一个球会跑出六边形框的 :alien:

点下重置球,转一秒就跑出去了,截图都来不及

3 个赞

大概率会的

目前我了解到的,问题不是很大,很快就要解决了,昇腾上训练只是成本比较高。

deepseek-v 系列一开始出圈就是编程

1 个赞

r2 or v4不会又是节前(端午)最后一天出吧? :smiling_face_with_three_hearts: