Grok 4 其实不差,但我不会用它

Grok 4 完整的测试下来倒也没有那么不堪,逻辑、数学、知识上还是很强悍的,但是审美、文笔、前端编程上不行

和简中测下来的一片唱衰不同,外网目前还是挺情绪高涨的,不知道是不是语言带来的回答差异

总之,Grok 4 没有那么差

但我想我不会用它

原因也很简单:Grok 4 没有创造一个让我用它的需求,也没有强到改变我的习惯

日常对话和最广泛的任务,我选择 Gemini 2.5 Pro,哈基米幻觉不算高,知识广度深度足够,最重要的是它爱说话,会说话,通人性,与 AI 们对话我能明显感觉到 Gemini 是语气最好的,也是说的最清楚的

Grok 4 给我感觉就是一个纯社恐理科生,能不说话就不说话,惜字如金,中文也不太好,OUT!


信息检索和深度思考我用 ChatGPT App 上的 o3 和 o3-pro,信息检索断层第一,思维足够强悍,可调用的工具也够多,Python能解决相当多的问题

Grok 4 完全打不过,OUT!


编程我用 Claude,没话讲,Augment 的 Claude 就是无敌

Grok 4 前端编程看起来还有倒退,OUT!


所以说,现在三大家 AI 在我这里已经各司其职了,Grok 作为外来者必须要在某一方面足够强大才能代替其中一个,或者它能够创造出一个全新的需求也可以

但显然,Grok 4 失败了

它是一个比较六边形的战士,它够强,可惜没有在任何一个方面做到“绝对的强”

至少就目前为止,我还是喜欢跟双子座侃侃而谈,与 o3 一起做 Fact-Check,和克劳德先生一起编写代码,反正,我是不会想起打开手机上不知道放在屏幕第几页的 Grok

33 个赞

选择太多了。

最重要的是习惯已经养成

2 个赞

就跟我一样,用习惯了cursor 一直在用 copolot 跟 aug 都没用 包括最近roo code 也没用过

1 个赞

等后面有人开发 Grok 4 新的使用领域

除了nsfw,找不到一个场景它是好用的,

做题以外的推理也不行

说到底还是不值那个价!

1 个赞

不太会中文的问题
英文效果明显好很多,确实很nb

1 个赞

看了看外网的实测,好像还可以(?

实际场景表现好像挺不错的,我看到的测试包括法律、商业、数学可视化、专家模型,都还不错

grok-4放开了免费给大伙儿用,大伙儿会让它代替pplx的位置的!

4 个赞

仍然是经典操作:
o3-pro负责帮我做Gemini做不出来的压轴题
Claude Sonnet 4 Think 负责给我讲知识点
Gemini 2.5 Pro是唯一一个能看懂我破烂书写的AI(

6 个赞

对我来说rp很重要,哈吉米目前是最舒服的

对的

我写到一半的草稿,懒得发了,大家看看就行了

这次之所以风评差异如此之大,原因之一就是语言差异

3 个赞

可以免费用吗

是的,Transformer模型的硬伤。
DeepSeek为例,DeepSeek R1-0528的中英文差距就不小…

3 个赞

省流:没找到自己的生态位,打不出差异

现在各家模型的语料都挖的差不多了,我猜应该是tokenizer的问题,不同的tokenizer策略导致的训练语料处理不同,进而导致不同语言效果差异巨大

2 个赞

语料挖的不全
试试Grok 4在英文和中文环境下nsfw
英文明显肚子里有东西

2 个赞

有道理,感觉是Tokenizer+RL语料的问题。

总之是经过一些简单的测试,Grok 4很容易在你的中文问题下用英文回答(

1 个赞

不给我免费用 凭什么用它

9 个赞