🔥【大模型系列26】关于Gemini 3.1 Pro,你想知道的一切【底楼更新LiveBench评分】

资料

官方文章:Gemini 3.1 Pro: Announcing our latest Gemini AI model
Model Card:Gemini 3.1 Pro - Model Card — Google DeepMind
文档/价格:https://ai.google.dev/gemini-api/docs/gemini-3

价格$2/$12不变,200k以上$4/$18
上下文1m不变
最大输出64k不变
训练截止日期:2501不变
新版deepthink底模应该是3.1
实际最终输出上限15k(不含思维链),gemini-3-pro是5k(Gemini 3.1 Pro体验:不用受3 Pro的气了,2.5 Pro 白月光终于回来了?写报告轻松破万字

评分

官方自评

LMArena评分

来源:Arena Leaderboard | Compare & Benchmark the Best Frontier AI Models





ArtificiAlanalysis评分

来源:Gemini 3.1 Pro Preview - Intelligence, Performance & Price Analysis


Humanity’s Last Exam


LiveBench 暂未上线

来源:https://livebench.a


ARC-AGI-2

来源:ARC Prize - Leaderboard


Chatbot渠道

官网/App

免费版也能用,但额度较低

AIStudio

OpenRouter Chatroom扣自己余额

来源:AI Chat Playground - Compare AI Models Side by Side | OpenRouter

LMArena Direct Chat免费,但限制最大输出

来源:Chat with Multiple Frontier AI Models

API渠道

AIStudio API

GCP API

OpenRouter API

来源:Gemini 3.1 Pro Preview - API, Providers, Stats | OpenRouter

IDE渠道

Antigravity已上线

注意Antigravity要更新到260219版本才能用3.1

Cursor已上线

64 个赞
:fire:【省钱系列6】L站Google/Antigravity/Gemini Ultra会员拼车经验
:fire:【省钱系列7】常见AI官价/额度,及优惠/羊毛/拼车价汇总【底楼更新闲鱼常见坑】
:fire:【大模型系列28】关于GPT-5.4-thinking和GPT-5.4-pro,你想知道的一切【底楼更新mini和nano】
:fire:【大模型系列27】关于Grok 4.2,你想知道的一切【底楼更新grok-4.2-beta2上线】
:fire:【省钱系列9】Claude Code Opus额度的秘密:2api的刀,与CC官方刀,此刀非彼刀,又被宰一刀
:fire:【图像视频系列5】Ultra会员NotebookLM视频预览新增Cinematic模式【更新实测体验】
【省钱系列8.10】Claude Code Max,Opus4.6,OAuth直连拼车方案的实践研究
:fire:【省钱系列11】我做的Claude Code Saver,争取做最强CC额度监控+省钱插件【预告贴】
:fire:【省钱系列10】最近Claude Code Max,Codex Team难民激增,最新渠道研究
:fire:【IDE系列3】Codex插件常见问题解决办法
:fire:【大模型系列29】关于Minimax 2.7,你想知道的一切【底楼更新Arena编程评分】
:fire:【大模型系列25】关于Qwen-3.5,你想知道的一切【百万上下文来了】
:fire:【省钱系列5】顶级会员:Gemini Ultra vs ChatGPT Pro【260306楼底更新Deep think常见问题】
:fire:【大模型系列21】关于GLM5,你想知道的一切【底楼更新Trae/Kilo免费】
:fire:【图像视频系列4】关于Seedance2,你想知道的一切,性能碾压Sora2/VEO3.1【260326更新海外上市】
:fire:【大模型系列22】关于Minimax M2.5,你想知道的一切【楼底更新OpenRouter月榜第一】
:fire:【大模型系列24】关于Doubao Seed 2.0 Pro,你想知道的一切【LMArena总榜第6】
:fire:【大模型系列23】关于Gemini 3.1 Deep Think新版,你想知道的一切
:fire:【省钱系列8】Claude Code Max,Opus-4.6的所有渠道研究【260321底楼更新OAuth直连拼车】
:fire:【提智降智系列1】未预训练内容造成严重降智,与各模型搜索能力研究
gemini3.1pro的输出就只有4000token吗
【AI大战短评系列3】真假1m上下文大战开打,CC Max 1m已上线,Antigravity 1m暂未上线

近期我其他文章

.🔥【提智降智系列1】未预训练内容造成严重降智,与各模型搜索能力研究
.🔥【资料系列2】Reddit所有AI板块大全【手工收集,长期更新】

.https://linux.do/t/topic/1664227
.🔥【省钱系列6】L站Google/Antigravity/Gemini Ultra会员拼车经验
.🔥【省钱系列5】顶级会员:Gemini Ultra vs ChatGPT Pro【260306楼底更新Deep think常见问题】

.🔥【大模型系列28】关于GPT-5.4-thinking和GPT-5.4-pro,你想知道的一切【底楼更新LiveBench登顶】
.🔥【大模型系列27】关于Grok 4.2,你想知道的一切【底楼更新grok-4.2-beta2上线】
.🔥【大模型系列26】关于Gemini 3.1 Pro,你想知道的一切【底楼更新LiveBench评分】
.🔥【大模型系列25】关于Qwen-3.5,你想知道的一切【百万上下文来了】
.🔥【大模型系列24】关于Doubao Seed 2.0 Pro,你想知道的一切【LMArena总榜第6】
.🔥【大模型系列23】关于Gemini 3.1 Deep Think新版,你想知道的一切
.🔥【大模型系列22】关于Minimax M2.5,你想知道的一切【楼底更新OpenRouter月榜第一】
.🔥【大模型系列21】关于GLM5,你想知道的一切【底楼更新Trae/Kilo免费】
.🔥【大模型系列20】关于Opus-4.6,你想知道的一切【底楼更新METR评测】
.🔥【大模型系列19】关于GPT-5.3-Codex与Codex App,你想知道的一切【底楼更新LiveBench,OpenRouter已上线】

.🔥【图像视频系列5】Ultra会员NotebookLM视频预览新增Cinematic模式【更新实测体验】
.🔥【图像视频系列4】关于Seedance2,你想知道的一切,性能碾压Sora2/VEO3.1【260211新增随变app不限量渠道】

5 个赞

第一时间赶到现场支持 :bili_057:

3.1 pro 还是滑动注意力吗,滑动窗口变大了?

5 个赞

SVG测试

提示词: Create a svg in html of a red Ferrari supercar

41 个赞

3.1拒绝角色问题

我之前在 Gemini pro 中使用教授角色,但在更新后它不再假装自己是教授。它总是说自己是 Gemini 而不是教授。Flash 运行正常,可以采用角色,但 Gemini pro 完全拒绝了我。
来源:https://www.reddit.com/r/GeminiAI/comments/1r9a6d3/gemini_31_pro_refuses_to_adopt_personas/

4 个赞

Gemini-3.1-pro与gemini-3-pro SVG对比视频

https://www.reddit.com/r/singularity/comments/1r95ed7/animated_svg_comparison_between_gemini_3_and_31/

1 个赞

太强了佬!

感觉语言风格变化很大,不爱输出格式化文本了,而且情绪稳定很多

没有加粗,没有分行了

3 个赞

感谢佬友!

cli没上线吗 佬

感谢总结

什么是滑动注意力:thinking:

8 个赞

感谢佬友分享

高概率是,但有不少改善

输出长度钢印测试可以安排下,据说这一代被解除了

试了一下,比2.5Pro差了一些。

不过,总算是能用了。不知道是钢印还是其他原因

1 个赞

大哥,你是真快。 :smiley:

是不会输出僵硬的分点表述文本了吗

当年o3最大输出长度理论上也是64k,但是实际上永远达不到

o3 经常卡3800字左右。

是我当时用过最差的模型。

o1 则是我第一个用过能超过10000字模型。

3 个赞