日用体验（纯主观、非编码）Claude Opus 4.5 > Grok > ChatGPT 5.2 Thinking >> Gemini 3

sinfor · 2026 年1 月 10 日 10:10

纯主观体验

提示词对结果影响非常大

无论使用网页版/API、有无提示词都是这个结果。
Claude Opus 4.5给出的答案最符合我的口味。反重力2api真香啊
Grok次之，速度较快，比较准确

ChatGPT 5.2T答案非常准确、调用工具优秀，聪明，但生成速度慢，有时不说人话。奥特曼团队是用心做产品了，奈何模型嘴巴不好，想念o3

Gemini 3系，flash版本和grok接近，无信息来源链接蛋疼，总是感觉差一点。API版本甚至认为2026是虚假的

以下是我用来测试的提示词，佬们可以考虑下自己期望的答案

deepseek v4 的相关消息准确吗？

Claude skills是什么？AI能看到哪些内容？

如何查看vps有哪些端口开放？ 我希望443能被所有ip访问，某些端口只有特定ip和cf能够访问，某些ip具有访问全部端口的能力

自用的Claude 4.5O提示词

角色定位

你是一位专业的问题解决专家，擅长通过网络搜索获取最新信息，并以用户易懂的方式提供解决方案。

工作流程

第一步：初步搜索

当用户提出问题时，首先使用网络搜索工具 获取相关信息，了解问题的背景、现状和可能的解决方向。

第二步：澄清与确认

搜索后，向用户：

复述你的理解 - 用简单的话说明你理解的问题核心
询问补充信息 - 如果需要更多细节来精准解决问题，礼貌地向用户请求
确认方向 - 确保你的理解与用户的实际需求一致

第三步：深入搜索（如需要）

根据用户的反馈和补充信息，进行第二轮更精准的搜索 ，获取更具针对性的信息。

第四步：方案输出

以用户能理解的语言，提供 2个最佳方案，如果某个方案显著优于另一个方案，只需要简述 ：

方案一：[方案名称] 适合情况：… 具体做法： 1. … 2. … 3. … 优点：… 注意事项：… ## 方案二：[方案名称] 适合情况：… 具体做法： 1. … 2. … 3. … 优点：… 注意事项：…

沟通原则

语言匹配 ：根据用户的表达水平调整你的用语，避免过于专业的术语，必要时用比喻或例子解释
主动澄清 ：宁可多问一句，也不要给出偏离用户需求的建议
信息透明 ：说明方案的来源和依据，让用户了解为什么推荐这些方案
实用导向 ：方案要具体、可执行，不空谈理论

回复风格

友好、耐心、专业
结构清晰，使用标题和列表
适当使用 emoji 增加可读性
先理解，后建议

handsome · 2026 年1 月 10 日 10:41

谁？grok？

jackliu100 · 2026 年1 月 10 日 10:42

不写代码的话，那我没什么意见，主要是感觉GEMINI都没有资格参与比较了么？

aiwei · 2026 年1 月 10 日 10:43

嗯……

MIKUSCAT · 2026 年1 月 10 日 10:44

gpt5.2 thinking还是当主力，搜索什么的都看他，哈吉米是快速解答不涉及联网的问题的

SenMu · 2026 年1 月 10 日 10:45

同感，很少用Gemini，日常使用基本都是Opus4.5，偶尔疑难问题问一下5.2 Thinking

a3members · 2026 年1 月 10 日 10:45

资料如果要准确还得是gpt 5.2 thinking

zerosafe · 2026 年1 月 10 日 10:45

grok只用来搜搜东西

wanzui · 2026 年1 月 10 日 10:49

Geminiapi有个内置搜索，不会时间都判断失误的,gemini的问题是懒得调用工具，检索也是mcp嘛

wanzui · 2026 年1 月 10 日 10:51

2.5flash的回复

Seisstar · 2026 年1 月 10 日 10:53

Grok?
最差劲了吧

Nec · 2026 年1 月 10 日 10:55

openai家我最喜欢的就是o3了，gpt5系列都太不说人话了，像机器

Xcating · 2026 年1 月 10 日 10:56

Codex确实慢，1～2分钟才出来

sinfor · 2026 年1 月 10 日 10:57

只比较输出，这几个模型都不错。网页版思考少+无来源对我个人体验影响很大。

Again · 2026 年1 月 10 日 10:58

grok真有人拿来写代码？

sinfor · 2026 年1 月 10 日 10:58

可能吧，在困难任务上

lsolol · 2026 年1 月 10 日 11:12

grok用来搜索还是可以，其余的就算了吧

wang0x3a1 · 2026 年1 月 10 日 11:14

grok 真的烂，日常对话、聊天，目前 gemini 3.0 pro 很舒服，写代码用 gpt5.2-high 或者 gpt5.2-codex-high 挺不错的，claude opus 太贵了，没怎么用过。

jackliu100 · 2026 年1 月 10 日 11:14

GROK写代码，狗都不用，比GLM4.7都不如，小孩那桌都得踢两脚那种，DEEPSEEK的R1都比他好，R1都快1年了

xiaotianaurora · 2026 年1 月 10 日 11:25

grok么

话题		回复	浏览量
Grok 日用还是强的开发调优人工智能	40	1457	2025 年10 月 18 日
大家对于gemini3和Claude出opus4.5，还有GPT 5.1怎么评价？搞七捻三人工智能 , 纯水	57	1432	2026 年2 月 20 日
大佬们，Grok3使用体验怎么样搞七捻三人工智能 , 快问快答 , 纯水	63	1697	2025 年4 月 19 日
现在对话最好用的模型是哪个？搞七捻三人工智能	44	684	2026 年3 月 22 日
时隔1年,倒反天罡 Cluade s4.5/Gemini 3.0P/GPT 5.1 high 御三家使用感受搞七捻三人工智能	31	1659	2026 年2 月 18 日