🔥【大模型系列23】关于Gemini 3.1 Deep Think新版，你想知道的一切

dwqxq1 · 2026 年2 月 15 日 05:03

介绍

官网：Gemini 3 Deep Think: AI model update designed for science
.Gemini Deep Think: Redefining the Future of Scientific Research — Google DeepMind

deep think智商高于底模的原理，Reddit用户推测是：gemini-3-deep-think和gpt-5.2-pro版本使用并行测试时间计算。它们不是单一的、一次性模型运行。相反，相同的输入会使用不同的随机种子运行8到10 次，并选择最佳结果。

上下文：192k，不是gemini3的1m

评测

官方自评

ARC-ARI-2评分

来源：ARC Prize - Leaderboard

Chatbot渠道

暂时只有官方网页版，必须Ultra会员，官价$250/月，头三月半价$125，
每天可用10次deepthink
L站拼车¥180左右/月，家庭组6人车，额度独立，
对于真用得到的人，如果不浪费额度，¥180÷30天÷10次=¥0.6/次，不算贵
另外Ultra会员的Antigravity Opus额度，Reddit用户估计是Pro会员的20倍
Pro的gemini-3-pro额度高，Opus额度最近一直砍，很低根本不够用

API渠道：未对公众开放

仅对科研人员开放

IDE渠道：未开放

自家Antigravity里也没有deepthink

dwqxq1 · 2026 年2 月 15 日 05:03

近期我其他文章

.🔥【提智降智系列1】未预训练内容造成严重降智，与各模型搜索能力研究
.🔥【资料系列2】Reddit所有AI板块大全【手工收集，长期更新】

.https://linux.do/t/topic/1664227
.🔥【省钱系列6】L站Google/Antigravity/Gemini Ultra会员拼车经验
.🔥【省钱系列5】顶级会员：Gemini Ultra vs ChatGPT Pro【260306楼底更新Deep think常见问题】

.🔥【图像视频系列5】Ultra会员NotebookLM视频预览新增Cinematic模式【更新实测体验】
.🔥【图像视频系列4】关于Seedance2，你想知道的一切，性能碾压Sora2/VEO3.1【260211新增随变app不限量渠道】

torvalds · 2026 年2 月 15 日 05:03

感谢分享~ 新年学不动了~

hunter666 · 2026 年2 月 15 日 05:15

来了佬！

dwqxq1 · 2026 年2 月 15 日 05:16

这Ultra一般用不起，中文评测很少，就找点英文评测吧

dwqxq1 · 2026 年2 月 15 日 05:16

Quixotica11y · 2026 年2 月 15 日 05:22

感谢分享！

Acheron · 2026 年2 月 15 日 05:27

感谢分享，不过貌似信息还不多？

dwqxq1 · 2026 年2 月 15 日 05:35

Deepthink贵啊，比较小众，买的人少，评测也少

另外Deepthink没有API，很多评测要连API才能跑评测程序

比如gpt-5.3-codex到现在都没有API，所以几乎所有评测榜都没有5.3

yay0i · 2026 年2 月 15 日 05:40

deepthink还是额度太少了，隔壁chatgpt pro比Gemini ultra便宜，GPT-5.2 pro还随便用

dwqxq1 · 2026 年2 月 15 日 05:43

更新ARC-AGI-2

这ARC-AGI-3估计应该快出了，ARC-AGI-2分数已经快不够用了
来源：ARC Prize - Leaderboard

dwqxq1 · 2026 年2 月 15 日 06:07

X上有人说新版deepthink底模是gemini-3.1-pro

老版deepthink是基于gemini-3-pro
这个理论说得通
分数一下提升这么多，deepthink应该只是一个高级Agent，不是独立的模型，如果同一底模，不太可能一下子涨分30%，ARC-AGI2直接翻倍有余
因为gemini-3.1-pro没上市，所以不能这么宣传
新模型先在高级会员首发特权，也是OpenAI惯用的拉$200会员销量的伎俩，Google学习下也正常
以上个人言论，真实性未知

有人发现deepthink官方文档的标题是gemini-3.1-pro并截图并发到X，现在标题已经被官方改掉了

官方文档：https://storage.googleapis.com/deepmind-media/gemini/gemini_3_deep_think_model_evaluation.pdf

发现者的X原贴：https://x.com/synthwavedd/status/2022003839784935536
Reddit讨论帖：https://www.reddit.com/r/Bard/comments/1r3l992/gemini_3_deep_think_was_really_gemini_31_pro_so/

handsome · 2026 年2 月 15 日 06:18

太强了，大佬

bige0123 · 2026 年2 月 15 日 06:21

严谨点，API渠道半开放，需要申请，一般是科研人员去

dwqxq1 · 2026 年2 月 15 日 06:33

关于CodeForces的分数3455含义

我统计了下

Gemini-3-deepthink=3455，超过3455分的人类，貌似有7个
gpt-5.2-pro=分数找不到，应该不比o3-pro强多少，否则早拿出来显摆了
o3-pro=2724~2748

gemini-3-pro=2512
opus4.6=2352

deepseek-r1=2029
o1=1683~2061分
o1-preview=1258

人类中位数是1143（评测超过6次以上）

deepseek3=1134
gpt-4o=759~808
sonnet3.5=717
gpt4=392分(2023年8月)

下图人类CodeForces的分数分布，图y轴是该分数段人数
来源：https://codeforces.com/blog/entry/126802

dwqxq1 · 2026 年2 月 15 日 07:09

SVG测试：鹈鹕骑自行车

来源：https://www.reddit.com/r/singularity/comments/1r3bl58/gemini_3_deep_think_svg_pelican_riding_a_bicycle/

gemini-3-deep-think

GPT-5.2-think

gemini-3-pro

theoneli · 2026 年2 月 15 日 08:20

感谢分享。。

Pho · 2026 年2 月 15 日 09:18

这个新的鹈鹕骑车有点离谱

garywu · 2026 年2 月 15 日 12:02