gemini直接识别中文问题似乎出错(还得是deepseek)

如图,输入一个简单的拼音问题:
##############################


##############################
gemini乱回答:

**
##############################

#################################
而deepseek深度思考,虽然有文字识别的错误,但是思考的都是对的:
#################################

#####################################
所以deepseek r1还是很有实力的,关键思考过程可见,我们可以自己检查是否模型思考的步骤和思路正确,吹爆deepseek :person_raising_hand:

冲3级,友友们求赞求赞!!!

3 个赞

你也没说是 Gemini 的哪一个模型。。

Gemini 2.0 Flash Thinking Experimental 01-21,这个模型

1 个赞

ai生成的内容请使用截图

1 个赞

问题是Gemini的多模态识别也错了,chang变成chong这样没什么可比性,没有控制变量

我咋感觉全错。。

3 个赞

已经改成截图了hh

B应该对的呀

但是网上大家说谷歌的优势不就是多模态么,但是反而识别出错了


谷歌的中文不是很差,比很多国内的都强tieba_087

助一臂之力

1 个赞

中文的话,三大家都赢不了deepseek吧,中英日我都在用,给我感觉就是英日和中文都不是一个维度的东西,特别联网搜索的话,不加research in english,respond in Chinese的话,有时候是真的难绷

3 个赞

确实
乞求的话就是第三声了

3 个赞

我尝试的时候直接截图了,所以可能就出错,自己手打感觉挺费事

  1. 我把问题用文字统一发给 Gemini 2.0 Flash Thinking Exp 和 DeepSeek-R1,两个模型都回答正确 所以无法得出 Gemini 在中文问题上比 DeepSeek 弱的结论
  2. 中文问题是中文问题,多模态是多模态。请分开谈论而不是混为一谈。Gemini 多模态识别错了,R1 则是根本没有多模态,文字识别也很多错误,这样做出来的结果并没有意义

为什么要做这样的实验,因为 Gemini 2.0 Flash Thinking Exp 这个模型个人测下来,无论是写作、古文、现代文阅读还是语言能力,其中文能力都比 DeepSeek-R1 强得多,而且 Chatbot Arena 上面中文类型 Gemini 2.0 Flash Thinking Exp 评分也是断崖第一

1 个赞

ocr一下

1 个赞

模型同时识图和答题能力会下降很多

1 个赞

好嘞hhhh,可能我的标题不准确,就是第一眼觉得错误比较低级,我还是考虑不全面 :joy:

1 个赞

你可以试一下用 Flash Thinking Exp 写作,那感觉完全不一样

research in english,respond in Chinese能提升搜索质量和回复可读性么