你们都觉得Claude 4 Sonnet好用?

为什么我的C4S傻了吧唧的呢 :bili_059:
不断的调用工具,反复改同一份文件,还经常偷懒罢工,问我要不要继续

8 个赞

对于免费账号,上下文太感人了

1 个赞

我觉得一般,不如gemini2.5

5 个赞

真的。。。没几句就到上限了

+1,感觉相比3.7它给自己加太多戏了,tool calling很牵强。完全没有发布时提到的"Enhanced tool use accuracy",mcp集成多了后经常出现无关的调用.

而且虽然4代开始支持了Extended thinking with tool use特性,理论上是推理和工具调用效率的进步,但仍然会导致重复的高频调用,并且会破坏prompt caching结构。无论api还是claude pro,用起来的消耗都高得吓人

2 个赞

是呗,刚用两下就到极限了

1 个赞

我用claude+open webui的mcp都没法调用工具,调用完不能自动继续。不知道是不是claude的特性需要专门加一条user消息才行

我觉得是模型本身就有问题,我Cursor Pro、Copilot Pro、Augment全都是一模一样的问题,我甚至可以说远不如C3.7S

挺好用的啊

1 个赞

如果是cursor的话,反复修改一个文件(并且实际没有修改)可能是网络问题。可以考虑开关一下magic

大帅哥没遇到过这些问题吗
我有个陈年老项目迁移到新版本外加修一些bug,C4S都做不下来

可能我的东西太简单了。。。

反复修一个文件是Copilot中出现的

Cursor中问题是偷懒,说了两三次keep going、continue后终于改完了,它还自作主张写了一个“健康度监测脚本”跑完全绿,结果pnpm run dev之后发现功能被它改没了,响应式布局被它改废了

白白浪费20分钟,我还好声好气的给他加油打气,结果依托,给我气的不行

4 个赞

如果是启用了推理时出现的情况,佬友可以看一下 Extended thinking with tool use 这部分的开发文档,新模型对推理内容的输出与补充工具调用结果后的二轮输入的数据结构有了更严格的一致性限制,可能需要等对话客户端额外适配了。

还真是
我用open webui加new api中转到claude的,但open webui不可能适配openai外的接口,不知道new api那里是不是可以做些什么。有空分析一下

点了 我最近都在用gemini 已经想放弃Claude了

不过我试了一下,好像claude3.7可以,claude3.7 extended thinking和claude 4都不行。似乎也不完全是extended thinking的问题

除了上下文,就没差过,有时候看你们吐槽都不知道点在哪里,没用cursor,就是官网那个

我觉得4比3.7 难用,经常改出的效果不如3.7,3个pro账号测试,,都是这个感受,然后我默默的换回了3.7

去写代码,试试稍微大一点的项目,完全不如C3.7S,感觉开倒车,目前各个测评数据也出来了,能力好了一点,但上下文召回、性能衰减、情商、写作都是开倒车的

1 个赞