Grok 4 其实不差，但我不会用它

VrianCao · 2025 年7 月 11 日 11:27

Grok 4 完整的测试下来倒也没有那么不堪，逻辑、数学、知识上还是很强悍的，但是审美、文笔、前端编程上不行

和简中测下来的一片唱衰不同，外网目前还是挺情绪高涨的，不知道是不是语言带来的回答差异

总之，Grok 4 没有那么差

但我想我不会用它

原因也很简单：Grok 4 没有创造一个让我用它的需求，也没有强到改变我的习惯

日常对话和最广泛的任务，我选择 Gemini 2.5 Pro，哈基米幻觉不算高，知识广度深度足够，最重要的是它爱说话，会说话，通人性，与 AI 们对话我能明显感觉到 Gemini 是语气最好的，也是说的最清楚的

Grok 4 给我感觉就是一个纯社恐理科生，能不说话就不说话，惜字如金，中文也不太好，OUT！

信息检索和深度思考我用 ChatGPT App 上的 o3 和 o3-pro，信息检索断层第一，思维足够强悍，可调用的工具也够多，Python能解决相当多的问题

Grok 4 完全打不过，OUT！

编程我用 Claude，没话讲，Augment 的 Claude 就是无敌

Grok 4 前端编程看起来还有倒退，OUT！

所以说，现在三大家 AI 在我这里已经各司其职了，Grok 作为外来者必须要在某一方面足够强大才能代替其中一个，或者它能够创造出一个全新的需求也可以

但显然，Grok 4 失败了

它是一个比较六边形的战士，它够强，可惜没有在任何一个方面做到“绝对的强”

至少就目前为止，我还是喜欢跟双子座侃侃而谈，与 o3 一起做 Fact-Check，和克劳德先生一起编写代码，反正，我是不会想起打开手机上不知道放在屏幕第几页的 Grok

mryu · 2025 年7 月 11 日 11:28

选择太多了。

VrianCao · 2025 年7 月 11 日 11:30

最重要的是习惯已经养成

mryu · 2025 年7 月 11 日 11:31

就跟我一样，用习惯了cursor 一直在用 copolot 跟 aug 都没用包括最近roo code 也没用过

snk · 2025 年7 月 11 日 11:31

等后面有人开发 Grok 4 新的使用领域

Mov · 2025 年7 月 11 日 11:38

除了nsfw，找不到一个场景它是好用的，

做题以外的推理也不行

Throttle · 2025 年7 月 11 日 11:39

说到底还是不值那个价！

Ghidra · 2025 年7 月 11 日 11:41

不太会中文的问题
英文效果明显好很多，确实很nb

VrianCao · 2025 年7 月 11 日 11:41

看了看外网的实测，好像还可以（？

实际场景表现好像挺不错的，我看到的测试包括法律、商业、数学可视化、专家模型，都还不错

dijunwanshou · 2025 年7 月 11 日 11:43

grok-4放开了免费给大伙儿用，大伙儿会让它代替pplx的位置的！

hanlinwenyuan · 2025 年7 月 11 日 11:43

仍然是经典操作：
o3-pro负责帮我做Gemini做不出来的压轴题
Claude Sonnet 4 Think 负责给我讲知识点
Gemini 2.5 Pro是唯一一个能看懂我破烂书写的AI（

MIKUSCAT · 2025 年7 月 11 日 11:43

对我来说rp很重要，哈吉米目前是最舒服的

VrianCao · 2025 年7 月 11 日 11:44

对的

我写到一半的草稿，懒得发了，大家看看就行了

这次之所以风评差异如此之大，原因之一就是语言差异

Leex · 2025 年7 月 11 日 11:45

可以免费用吗

hanlinwenyuan · 2025 年7 月 11 日 11:46

是的，Transformer模型的硬伤。
DeepSeek为例，DeepSeek R1-0528的中英文差距就不小…

qimingfan10 · 2025 年7 月 11 日 11:47

省流：没找到自己的生态位，打不出差异

VrianCao · 2025 年7 月 11 日 11:51

现在各家模型的语料都挖的差不多了，我猜应该是tokenizer的问题，不同的tokenizer策略导致的训练语料处理不同，进而导致不同语言效果差异巨大

hanlinwenyuan · 2025 年7 月 11 日 11:51

语料挖的不全
试试Grok 4在英文和中文环境下nsfw
英文明显肚子里有东西

WenDavid · 2025 年7 月 11 日 11:52

有道理，感觉是Tokenizer+RL语料的问题。

总之是经过一些简单的测试，Grok 4很容易在你的中文问题下用英文回答（

StellaFortuna · 2025 年7 月 11 日 11:53

不给我免费用凭什么用它

话题		回复	浏览量
大佬们，Grok3使用体验怎么样搞七捻三人工智能 , 快问快答 , 纯水	63	1697	2025 年4 月 19 日
Grok 日用还是强的开发调优人工智能	40	1457	2025 年10 月 18 日
日用体验（纯主观、非编码）Claude Opus 4.5 > Grok > ChatGPT 5.2 Thinking >> Gemini 3 搞七捻三人工智能 , 纯水	57	1466	2026 年1 月 11 日
有佬試著用Grok4了嗎？怎麽樣？搞七捻三快问快答	27	508	2025 年7 月 12 日
为什么都在搞grok？grok感觉不太好用啊，问国内的各方面都不如ds，它的参考资料全是英文的开发调优人工智能	41	1475	2025 年4 月 1 日