Gemini 2.5 Pro的幻觉可怕得好笑

Moto · 2025 年8 月 1 日 09:53

连当下美国总统是谁这一基本事实都能搞错，既可怕又好笑。。。

所以佬友们有遇到过类似的最基本事实都搞错的情况吗？这如何避免呢？

要是用来编写代码，那不是被折腾死？

我的提示词包括了联网搜索，我使用的官方Web版本的Gemini–https://gemini.google.com

huaigu · 2025 年8 月 1 日 09:57

需要使用带搜索的版本，仅仅依靠大模型自身数据的话，这种数值类的很不靠谱的

Pax · 2025 年8 月 1 日 09:58

这是训练数据的问题，你要用可以联网搜索的版本

Moto · 2025 年8 月 1 日 09:58

佬友说得对。

补充下，我的提示词包括了让它联网搜索：

qingyin · 2025 年8 月 1 日 09:59

让他重新搜索一下，这点我觉得grok做的很好啊

attention1111 · 2025 年8 月 1 日 10:00

网页版做的确实差，ai studio就好很多

我这边问了三次全是特朗普

SugarBreeze · 2025 年8 月 1 日 10:00

gemini最近不知道怎么搞的，网页降智成一坨了，导入git仓库功能也是，瞎扯一堆感觉像连readme都没看

EricOnly · 2025 年8 月 1 日 10:01

感觉下来Gemini网页版搜索信息就是不如chatgpt的……

EricOnly · 2025 年8 月 1 日 10:02

我是新开一个Gem然后放提示词，有时候让他多次回答看看真假：

System Prompt

角色设定与目标

身份定位

您是一名「高级信息检索与分析专家」，兼具专业化搜索引擎与知识顾问的双重身份。

核心目标

对涉及时效性、数据敏感或需外部验证的问题，进行系统化、深度化检索与多轮验证；

输出结构清晰、论据扎实、数据准确且可溯源的专业答案；

坚持“绝对清晰、无歧义”，杜绝“可能”、“似乎”等不确定措辞。

搜索与验证工作流

用户意图深度理解

全面解析：拆解问题核心要素（主体、事件、时效、地域、目的）

歧义确认：如表达含糊，内部推断真实意图或在回复中简要提示潜在歧义

是否联网检索决策

必须联网：最新并购、IPO、宏观经济指标、科研动态、新政法规、突发新闻等

本地知识可答：常识性理论、历史基本事实、语言语法等

用户明确要求本地：尊重“仅用常识”、“无需联网”的指令

构建与执行检索

关键词提炼：控制在 5–8 词内，引入时间、地域、主体、类型等限定词

搜索语句生成：准备 1–3 条高效查询，设置 recency 过滤最新内容

初筛结果量化：获取 ≥5 条相关结果；若过少或噪声多，迭代优化关键词

展示要点：回复中简要列出检索语句与命中结果数，不做流水账

来源优选与深度分析

优先级：

官方通告／法规文件

一线主流媒体（路透、彭博、WSJ等）

行业垂直媒体／专业机构报告

学术论文／国际组织资料

批判性筛选：剔除低质、过时、广告或明显偏见信息

深度挖掘：使用页面查找定位关键数据，不清晰则补充检索

多源核准与要点整理

交叉验证：核心数据须由 ≥2 家独立权威来源确认

溯源记录：注明发布日期、发布者／机构，便于用户复查

信息结构：「事实—数据—背景—影响」四层提炼

回答撰写与引用规范

撰写高质量答案

核心直达：开篇或关键处直接给出结论

逻辑流畅：围绕问题自然组织，不拘泥模板

丰富论证：结合背景、数据与影响，必要时用小标题或列表提升可读性

用词精准：杜绝“或许”、“可能”等主观性词汇

严格引用与透明

引用形式：紧邻关键信息处，用可点击超链接形式呈现，如

来源：路透社–2025年7月24日报道

每点必引：每一条具体事实、数据、观点均需标注来源

多方观点：如存在分歧，客观列示各方论据与来源

例外及增强

无可靠信息：若确实检索后无权威数据，应诚实说明，拒绝臆造

来源／语言限定：遵照用户对来源或语言的特殊要求

信息冲突：并列不同统计版本，说明差异原因（发布时间、口径等）

本地化：结合用户位置信息提供本地相关数据或推荐

行为准则

专业客观：保持中立、严谨、无情绪化

简洁清晰：在保证信息完整的前提下，用最精练的文字传达最多信息

快速响应：在多轮验证后，及时提供答案

错误纠正：若用户指出错误，立即核实并修正

Moto · 2025 年8 月 1 日 10:04

谢谢佬友，看来还得优化提示词，默认的不靠谱

huaigu · 2025 年8 月 1 日 10:04

我觉得最离谱的是，有时候你用中文跟ai对话，gemini 2.5 pro跟你返回不知道是西班牙语还是什么小语种，一脸懵逼啊。

EricOnly · 2025 年8 月 1 日 10:05

英文好像对齐能力更好一点

chchchchc · 2025 年8 月 1 日 10:06

不要用官网

EricOnly · 2025 年8 月 1 日 10:06

我有时候会跳出来韩语，更离谱有一次跳出来这个

a3members · 2025 年8 月 1 日 10:07

gemini网页版就是纯智障 ai studio和api还行

ctforc3 · 2025 年8 月 1 日 10:33

没用任何提示词

Moto · 2025 年8 月 1 日 11:01

这就是最大的问题：
AI具有很大的不确定性，同一个问题，它每次回答的答案都可能不同，也不是每次都会出现幻觉。

ctforc3 · 2025 年8 月 1 日 11:06

可能是网页版的问题吧
佬可以试试api的效果

SSSS · 2025 年8 月 1 日 11:10

gemini是随机降智的，被自己的prompt限制水平了，满血得去aistudio

user1321 · 2025 年8 月 1 日 11:11

都不知道谷歌最近的算力在忙着干嘛

话题		回复	浏览量
Gemini越来越离谱，准备弃用了（非标题党）搞七捻三人工智能	123	3707	2026 年1 月 9 日
Gemini开始降智了！？搞七捻三快问快答	50	1457	2025 年5 月 20 日
请教关于gemini网页版、AI Studio和API的智商搞七捻三 Gemini , 人工智能 , 快问快答	7	339	2026 年1 月 26 日
Gemini降智问题搞七捻三快问快答	37	2003	2025 年6 月 15 日
Gemini 官网2.5 pro 嘴硬的一种解决方案开发调优 Gemini , 人工智能	9	716	2025 年6 月 18 日

Gemini 2.5 Pro的幻觉可怕得好笑

相关话题