你们都觉得Claude 4 Sonnet好用？

VrianCao · 2025 年5 月 25 日 14:52

为什么我的C4S傻了吧唧的呢
不断的调用工具，反复改同一份文件，还经常偷懒罢工，问我要不要继续

tgedang · 2025 年5 月 25 日 14:57

对于免费账号，上下文太感人了

agluo · 2025 年5 月 25 日 14:57

我觉得一般，不如gemini2.5

riv · 2025 年5 月 25 日 14:58

真的。。。没几句就到上限了

carlpayne · 2025 年5 月 25 日 14:59

+1，感觉相比3.7它给自己加太多戏了，tool calling很牵强。完全没有发布时提到的"Enhanced tool use accuracy"，mcp集成多了后经常出现无关的调用.

而且虽然4代开始支持了Extended thinking with tool use特性，理论上是推理和工具调用效率的进步，但仍然会导致重复的高频调用，并且会破坏prompt caching结构。无论api还是claude pro，用起来的消耗都高得吓人

zhxhwyzh14 · 2025 年5 月 25 日 15:00

是呗，刚用两下就到极限了

funnycups · 2025 年5 月 25 日 15:01

我用claude+open webui的mcp都没法调用工具，调用完不能自动继续。不知道是不是claude的特性需要专门加一条user消息才行

VrianCao · 2025 年5 月 25 日 15:01

我觉得是模型本身就有问题，我Cursor Pro、Copilot Pro、Augment全都是一模一样的问题，我甚至可以说远不如C3.7S

handsome · 2025 年5 月 25 日 15:04

挺好用的啊

carlpayne · 2025 年5 月 25 日 15:05

如果是cursor的话，反复修改一个文件（并且实际没有修改）可能是网络问题。可以考虑开关一下magic

VrianCao · 2025 年5 月 25 日 15:05

大帅哥没遇到过这些问题吗
我有个陈年老项目迁移到新版本外加修一些bug，C4S都做不下来

handsome · 2025 年5 月 25 日 15:06

可能我的东西太简单了。。。

VrianCao · 2025 年5 月 25 日 15:07

反复修一个文件是Copilot中出现的

Cursor中问题是偷懒，说了两三次keep going、continue后终于改完了，它还自作主张写了一个“健康度监测脚本”跑完全绿，结果pnpm run dev之后发现功能被它改没了，响应式布局被它改废了

白白浪费20分钟，我还好声好气的给他加油打气，结果依托，给我气的不行

carlpayne · 2025 年5 月 25 日 15:08

如果是启用了推理时出现的情况，佬友可以看一下 Extended thinking with tool use 这部分的开发文档，新模型对推理内容的输出与补充工具调用结果后的二轮输入的数据结构有了更严格的一致性限制，可能需要等对话客户端额外适配了。

funnycups · 2025 年5 月 25 日 15:14

还真是
我用open webui加new api中转到claude的，但open webui不可能适配openai外的接口，不知道new api那里是不是可以做些什么。有空分析一下

shiyunqq · 2025 年5 月 25 日 15:14

点了我最近都在用gemini 已经想放弃Claude了

funnycups · 2025 年5 月 25 日 15:16

不过我试了一下，好像claude3.7可以，claude3.7 extended thinking和claude 4都不行。似乎也不完全是extended thinking的问题

6868888 · 2025 年5 月 25 日 15:16

除了上下文，就没差过，有时候看你们吐槽都不知道点在哪里，没用cursor，就是官网那个

dext7r · 2025 年5 月 25 日 15:17

我觉得4比3.7 难用，经常改出的效果不如3.7，3个pro账号测试，，都是这个感受，然后我默默的换回了3.7

VrianCao · 2025 年5 月 25 日 15:21

去写代码，试试稍微大一点的项目，完全不如C3.7S，感觉开倒车，目前各个测评数据也出来了，能力好了一点，但上下文召回、性能衰减、情商、写作都是开倒车的

话题		回复	浏览量
Cursor auto和gemini2.5pro都蠢的让人抓狂，怎么办？开发调优人工智能 , Cursor	25	835	2025 年7 月 22 日
别再吹 Gemini 2.5 Pro 了，写代码就是一坨搞七捻三 Gemini , 软件开发	77	4214	2025 年8 月 10 日
claude-3.5-sonnet已经可以完美替代gpt-4o 资源荟萃人工智能	45	2130	2025 年1 月 27 日
你们有没有觉得claude code越来越傻了搞七捻三 Claude , 人工智能 , 纯水	51	1298	2025 年8 月 12 日
好奇模型的编程排名开发调优人工智能 , 快问快答	29	1127	2025 年7 月 3 日