gemini直接识别中文问题似乎出错（还得是deepseek)

heshuiXiong · 2025 年2 月 11 日 03:23

如图，输入一个简单的拼音问题：
##############################

##############################
gemini乱回答：

**
##############################

#################################
而deepseek深度思考，虽然有文字识别的错误，但是思考的都是对的：
#################################

#####################################
所以deepseek r1还是很有实力的，关键思考过程可见，我们可以自己检查是否模型思考的步骤和思路正确，吹爆deepseek

冲3级，友友们求赞求赞！！！

EFL · 2025 年2 月 11 日 03:25

你也没说是 Gemini 的哪一个模型。。

heshuiXiong · 2025 年2 月 11 日 03:25

Gemini 2.0 Flash Thinking Experimental 01-21，这个模型

LuoH-AN · 2025 年2 月 11 日 03:30

ai生成的内容请使用截图

EFL · 2025 年2 月 11 日 03:31

问题是Gemini的多模态识别也错了，chang变成chong这样没什么可比性，没有控制变量

handsome · 2025 年2 月 11 日 03:32

我咋感觉全错。。

heshuiXiong · 2025 年2 月 11 日 03:34

已经改成截图了hh

heshuiXiong · 2025 年2 月 11 日 03:34

B应该对的呀

heshuiXiong · 2025 年2 月 11 日 03:35

但是网上大家说谷歌的优势不就是多模态么，但是反而识别出错了

yangtb2024 · 2025 年2 月 11 日 03:36

谷歌的中文不是很差，比很多国内的都强

wwow · 2025 年2 月 11 日 03:38

助一臂之力

YU_TAKASAKI · 2025 年2 月 11 日 03:38

中文的话，三大家都赢不了deepseek吧，中英日我都在用，给我感觉就是英日和中文都不是一个维度的东西，特别联网搜索的话，不加research in english，respond in Chinese的话，有时候是真的难绷

handsome · 2025 年2 月 11 日 03:39

确实
乞求的话就是第三声了

heshuiXiong · 2025 年2 月 11 日 03:39

我尝试的时候直接截图了,所以可能就出错，自己手打感觉挺费事

EFL · 2025 年2 月 11 日 03:39

我把问题用文字统一发给 Gemini 2.0 Flash Thinking Exp 和 DeepSeek-R1，两个模型都回答正确 所以无法得出 Gemini 在中文问题上比 DeepSeek 弱的结论

image1123×2463 266 KB
中文问题是中文问题，多模态是多模态。请分开谈论而不是混为一谈。Gemini 多模态识别错了，R1 则是根本没有多模态，文字识别也很多错误，这样做出来的结果并没有意义

为什么要做这样的实验，因为 Gemini 2.0 Flash Thinking Exp 这个模型个人测下来，无论是写作、古文、现代文阅读还是语言能力，其中文能力都比 DeepSeek-R1 强得多，而且 Chatbot Arena 上面中文类型 Gemini 2.0 Flash Thinking Exp 评分也是断崖第一

yangtb2024 · 2025 年2 月 11 日 03:39

ocr一下

yangtb2024 · 2025 年2 月 11 日 03:40

模型同时识图和答题能力会下降很多

heshuiXiong · 2025 年2 月 11 日 03:41

好嘞hhhh,可能我的标题不准确，就是第一眼觉得错误比较低级，我还是考虑不全面

EFL · 2025 年2 月 11 日 03:42

你可以试一下用 Flash Thinking Exp 写作，那感觉完全不一样

heshuiXiong · 2025 年2 月 11 日 03:44

research in english，respond in Chinese能提升搜索质量和回复可读性么

话题		回复	浏览量
2025年4月哪家模型对中文的支持最好答案最准确开发调优人工智能	27	522	2025 年6 月 11 日
选择 ChatGPT（GPT-4o、o3……）还是 Gemini（Gemini 2.5 Pro Preview）？一些个人看法及体验搞七捻三 ChatGPT , Gemini , 人工智能	46	3495	2025 年6 月 11 日
我在做不同任务时的模型选择策略（综合能力、成本、速度、个人喜好考虑）搞七捻三人工智能 , 纯水	57	1010	2025 年3 月 25 日
Google又一“神仙打架”之作，Gemini 2.0全线来袭：Flash、Pro、Lite三大版本前沿快讯	20	817	2025 年3 月 9 日
中翻英，AI率100% 佬友有无解决方案？搞七捻三 ChatGPT , 人工智能 , 快问快答 , 纯水	32	1057	2025 年5 月 8 日

gemini直接识别中文问题似乎出错（还得是deepseek)

相关话题