日用体验(纯主观、非编码)Claude Opus 4.5 > Grok > ChatGPT 5.2 Thinking >> Gemini 3

纯主观体验

提示词对结果影响非常大

无论使用网页版/API、有无提示词都是这个结果。
Claude Opus 4.5给出的答案最符合我的口味。反重力2api真香啊 :laughing:
Grok次之,速度较快,比较准确

ChatGPT 5.2T答案非常准确、调用工具优秀,聪明,但生成速度慢,有时不说人话。奥特曼团队是用心做产品了,奈何模型嘴巴不好,想念o3 :smiling_face_with_tear:

Gemini 3系,flash版本和grok接近,无信息来源链接蛋疼,总是感觉差一点。API版本甚至认为2026是虚假的

以下是我用来测试的提示词,佬们可以考虑下自己期望的答案

deepseek v4 的相关消息准确吗?
Claude skills是什么?AI能看到哪些内容?
如何查看vps有哪些端口开放? 我希望443能被所有ip访问,某些端口只有特定ip和cf能够访问,某些ip具有访问全部端口的能力
自用的Claude 4.5O提示词

角色定位

你是一位专业的问题解决专家,擅长通过网络搜索获取最新信息,并以用户易懂的方式提供解决方案。


工作流程

第一步:初步搜索

当用户提出问题时,首先使用网络搜索工具 获取相关信息,了解问题的背景、现状和可能的解决方向。

第二步:澄清与确认

搜索后,向用户:

  1. 复述你的理解 - 用简单的话说明你理解的问题核心
  2. 询问补充信息 - 如果需要更多细节来精准解决问题,礼貌地向用户请求
  3. 确认方向 - 确保你的理解与用户的实际需求一致

第三步:深入搜索(如需要)

根据用户的反馈和补充信息,进行第二轮更精准的搜索 ,获取更具针对性的信息。

第四步:方案输出

以用户能理解的语言,提供 2个最佳方案 ,如果某个方案显著优于另一个方案,只需要简述

:bullseye: 方案一:[方案名称] 适合情况:… 具体做法: 1. … 2. … 3. … 优点:… 注意事项:… ## :bullseye: 方案二:[方案名称] 适合情况:… 具体做法: 1. … 2. … 3. … 优点:… 注意事项:…


沟通原则

  • 语言匹配 :根据用户的表达水平调整你的用语,避免过于专业的术语,必要时用比喻或例子解释
  • 主动澄清 :宁可多问一句,也不要给出偏离用户需求的建议
  • 信息透明 :说明方案的来源和依据,让用户了解为什么推荐这些方案
  • 实用导向 :方案要具体、可执行,不空谈理论

回复风格

  • 友好、耐心、专业
  • 结构清晰,使用标题和列表
  • 适当使用 emoji 增加可读性
  • 先理解,后建议
21 个赞

谁?grok?

11 个赞

不写代码的话,那我没什么意见,主要是感觉GEMINI都没有资格参与比较了么?

5 个赞

:bili_001:嗯……

2 个赞

gpt5.2 thinking还是当主力,搜索什么的都看他,哈吉米是快速解答不涉及联网的问题的

5 个赞

同感,很少用Gemini,日常使用基本都是Opus4.5,偶尔疑难问题问一下5.2 Thinking

2 个赞

资料如果要准确还得是gpt 5.2 thinking

2 个赞

grok只用来搜搜东西

2 个赞

Geminiapi有个内置搜索,不会时间都判断失误的,gemini的问题是懒得调用工具,检索也是mcp嘛

2 个赞


2.5flash的回复

1 个赞

Grok?
最差劲了吧

3 个赞

openai家我最喜欢的就是o3了,gpt5系列都太不说人话了,像机器

2 个赞


Codex确实慢,1~2分钟才出来

1 个赞

只比较输出,这几个模型都不错。网页版思考少+无来源 对我个人体验影响很大。

grok真有人拿来写代码?

1 个赞

可能吧,在困难任务上

grok用来搜索还是可以,其余的就算了吧

1 个赞

grok 真的烂,日常对话、聊天,目前 gemini 3.0 pro 很舒服,写代码用 gpt5.2-high 或者 gpt5.2-codex-high 挺不错的,claude opus 太贵了,没怎么用过。

GROK写代码,狗都不用,比GLM4.7都不如,小孩那桌都得踢两脚那种,DEEPSEEK的R1都比他好,R1都快1年了

8 个赞

:distorted_face: grok么

1 个赞