GPT-5 系列有关的各方面的一些经验分享

B3000Kcn · 2025 年8 月 22 日 20:55

官方的风控非常严，比 GCP 还严，仅次于 Claude。
我访问 Platform 的 IP 是一个非常小众的英国服务商的 IP，虽是机房 IP 但非常干净。我发出请求的 IP 是美国家宽 IP，也非常干净。
我绑卡是用的 Dupay（原 Depay），实测招行全币种不行（这张卡可绑 GCP）。
我项目认证用的是大陆护照。
项目认证一次只能一个项目，第二个项目要 90 天后。
我有一个项目充钱收税，另一个项目充钱不收税，但没看出来有啥区别，有知道的佬友请不吝赐教
冲 5 刀进入 tier 1，但 tier 1 是没法用的（GPT-5 TPM 30000），tier 2 才可用。tier 2 要满足两个条件：第一个是首次充值 7 天后，另一个是累计 50 刀。
官方 API 有一个 flex 层，这个层的价格是标准价格的一半，在请求中加入 "service_tier": "flex" 即可发出 flex 层请求。
Flex 层的代价是不保证响应速度，甚至会 504，甚至会连续 504。
官方渠道 504 钱照扣，Openrouter 渠道我不清楚。如果发生连续 504，建议换模型。
Openrouter 好像是不能传递 service_tier，如果有佬友知道如何传递请不吝赐教
Openrouter 除了 GPT-5，其他三个模型都可以直接请求，只有 GPT-5 需要设置官方的 Key 才能请求。
Openrouter 走官方 Key 的请求扣官方那边的钱，Openrouter 这边不扣钱。
官方 API 可能有结构化隔离，有内置数组，不接受 content 数组。有些项目，比如 VCPToolBox，提示词中的变量可能无法被接收。
通过 Openrouter 转发到官方（设置官方 Key），可以解决上面那条的问题。
GPT-5-mini 应该就是纯血 Horizon。这个模型的注意力非常逆天，智力也很高，但除此之外都是缺点，似乎上下文也有水分。各位可以考虑有没有什么使用场景适合它，建议不要直接无视。
GPT-5 的 "reasoning_effort": "high" 不仅影响推理时间，很可能也影响输出模型。有认识的大佬说 GPT-5-High 的输出模型是 o4-Pro。
GPT-5-High 非常强，至少是比 Gemini 0605 强的。而且 Flex 层的 GPT-5-High 其实已经算是性价比模型了，0.625 刀输入，0.0625 刀缓存，5 刀输出，和它的能力完全不匹配。
Flex 层 GPT-5-High（未 504）消耗参考案例：Kilo Code 中对我的一个项目仓库进行从头分析，积累上下文58.6k，消耗 0.8 刀。

大概就这些吧，希望能帮到各位佬友

zhangshunfei · 2025 年8 月 22 日 21:00

这里的能再详细讲讲吗

B3000Kcn · 2025 年8 月 22 日 21:03

我知道的也就这么多了
mini 是 horizon 我是比较确定的，因为我在那几天高强度玩了 horizon，mini 和它几乎一模一样。但后面那个我不确定，我是听人说的，但是 High 比没有 High 确实强不少

zhangshunfei · 2025 年8 月 22 日 21:05

这么看起来还可以啊，oai还是有点东西

B3000Kcn · 2025 年8 月 22 日 21:06

真的是，我都没想到 openai 有一天会和性价比沾边

apparition · 2025 年8 月 22 日 21:09

我记得看过几个评论说 GPT-5-High 容易吃满上下文
GPT-5-Medium 反而能达到性能与上下文消耗的平衡

B3000Kcn · 2025 年8 月 22 日 21:12

我用下来感觉 high 的上下文消耗还行

Juya · 2025 年8 月 22 日 22:45

价值连城的实际经验，感谢佬分享！

catlog22 · 2025 年8 月 23 日 00:36

就我的感觉，如果你的主要场景是科研的话，gpt5应该是最佳的，数学逻辑能力很强。gpt5-mini基本可以平替claude4，可以试试copilot，现在免费。工具使用基本与claude差不多，细节把控更强些。

attention1111 · 2025 年8 月 23 日 00:38

GPT5确实越用越好用，可惜我api过kyc失败了

outgoing · 2025 年8 月 23 日 00:39

啊，四点多就起来发帖了

neteroster · 2025 年8 月 23 日 00:46

3.除了 Google 其他家 AI 产品（Claude、OpenAI）均不允许大陆 / 香港发卡行发行的 VISA / MasterCard。本质上 Google 的 AI 服务也明确不支持大陆和香港使用，但是现在没在付款方式上卡。
6.看账单地址
11.不支持
13.当然… 怎么可能扣两次
16.这个模型工具调用能力很不错，可以当便宜 agent 模型来用
18.一般来说不会影响模型（至少目前没有显著的证据），这个只是提示词有变化（影响 system 中的 juice），模型做过针对性训练，和开源的 oss 那种差不多，但 juice 应该控制粒度更细

补充几点：

多轮对话和 agent 应用推荐使用 Responses API，GPT-5 系列用 Responses API 的缓存命中率很高，而且可以避免很多重复思考
GPT-5 系列支持了一个新的参数 verbosity，在 Cherry Studio 上体现为左侧设置栏里的“详细程度”，这一点可以更改模型返回（非思维链）的详细性，如果喜欢简洁的可以改成 low，喜欢事无巨细（也包含废话的）可以选 high。不过目前 Cherry Studio 有 bug ，这个选项仅在使用 Responses API 时生效
默认情况下 GPT-5 系列 API 返回纯文本（plaintext）样式，如需 Markdown 样式的代码块和公式可以在系统提示词加入下列可选说明：

1. 使用 `...` 包裹行内代码，
```
...
```
包裹块（行间）代码

2. 使用 $...$ 包裹行间(inline) 公式，
$$
...
$$
包裹块(block) 公式。

Azure 的渠道的 GPT-5 似乎在响应延迟上不如官方渠道稳定

kindlei · 2025 年8 月 23 日 00:46

谢谢分享

wystyler · 2025 年8 月 23 日 00:53

感谢佬的分享

handsome · 2025 年8 月 23 日 01:03

感谢大佬。

chesha1 · 2025 年8 月 23 日 01:06

怪不得有的转发站 gpt-5-high 比别家慢那么多，是不是偷偷加 service_tier 又不告诉用户

qqq123 · 2025 年8 月 23 日 01:16

感谢大佬分享

VrianCao · 2025 年8 月 23 日 01:17

gpt-5-high 是真的很强，这次的 GPT-5 一定要记得设置这个 reasoning_effort，能 high 就 high

不知道这都是从谁开始说的，大家都认为GPT-5只是一个模型选择器？

当然，从逻辑上推，那这位大佬说的倒也没什么问题，毕竟如果按照原本的命名结构，GPT-5的Reasoning系列其实就是o4-series

xingtong8142 · 2025 年8 月 23 日 01:25

佬友平时用的网页端还是API？

VrianCao · 2025 年8 月 23 日 01:30

事实是，低价API很有可能都不是OAI官方platform，而是薅的azure

话题		回复	浏览量
选择 ChatGPT（GPT-4o、o3……）还是 Gemini（Gemini 2.5 Pro Preview）？一些个人看法及体验搞七捻三 ChatGPT , Gemini , 人工智能	46	3495	2025 年6 月 11 日
继续吐槽 GPT-5.4 系列搞七捻三 ChatGPT , 人工智能	31	650	2026 年4 月 2 日
时隔1年,倒反天罡 Cluade s4.5/Gemini 3.0P/GPT 5.1 high 御三家使用感受搞七捻三人工智能	31	1656	2026 年2 月 18 日
生日祝福词创作 gpt5.4 VS claude4.6o 开发调优 ChatGPT , Claude , 人工智能 , 纯水	15	186	2026 年3 月 8 日
今晚你站OAI还是站GEMINI？搞七捻三人工智能	124	2565	2025 年1 月 25 日

GPT-5 系列有关的各方面的一些经验分享

相关话题