GPT-5 系列有关的各方面的一些经验分享

  1. 官方的风控非常严,比 GCP 还严,仅次于 Claude。
  2. 我访问 Platform 的 IP 是一个非常小众的英国服务商的 IP,虽是机房 IP 但非常干净。我发出请求的 IP 是美国家宽 IP,也非常干净。
  3. 我绑卡是用的 Dupay(原 Depay),实测招行全币种不行(这张卡可绑 GCP)。
  4. 我项目认证用的是大陆护照。
  5. 项目认证一次只能一个项目,第二个项目要 90 天后。
  6. 我有一个项目充钱收税,另一个项目充钱不收税,但没看出来有啥区别,有知道的佬友请不吝赐教 :folded_hands:
  7. 冲 5 刀进入 tier 1,但 tier 1 是没法用的(GPT-5 TPM 30000),tier 2 才可用。tier 2 要满足两个条件:第一个是首次充值 7 天后,另一个是累计 50 刀。
  8. 官方 API 有一个 flex 层,这个层的价格是标准价格的一半,在请求中加入 "service_tier": "flex" 即可发出 flex 层请求。
  9. Flex 层的代价是不保证响应速度,甚至会 504,甚至会连续 504。
  10. 官方渠道 504 钱照扣,Openrouter 渠道我不清楚。如果发生连续 504,建议换模型。
  11. Openrouter 好像是不能传递 service_tier,如果有佬友知道如何传递请不吝赐教 :folded_hands:
  12. Openrouter 除了 GPT-5,其他三个模型都可以直接请求,只有 GPT-5 需要设置官方的 Key 才能请求。
  13. Openrouter 走官方 Key 的请求扣官方那边的钱,Openrouter 这边不扣钱。
  14. 官方 API 可能有结构化隔离,有内置数组,不接受 content 数组。有些项目,比如 VCPToolBox,提示词中的变量可能无法被接收。
  15. 通过 Openrouter 转发到官方(设置官方 Key),可以解决上面那条的问题。
  16. GPT-5-mini 应该就是纯血 Horizon。这个模型的注意力非常逆天,智力也很高,但除此之外都是缺点,似乎上下文也有水分。各位可以考虑有没有什么使用场景适合它,建议不要直接无视。
  17. GPT-5 的 "reasoning_effort": "high" 不仅影响推理时间,很可能也影响输出模型。有认识的大佬说 GPT-5-High 的输出模型是 o4-Pro。
  18. GPT-5-High 非常强,至少是比 Gemini 0605 强的。而且 Flex 层 的 GPT-5-High 其实已经算是性价比模型了,0.625 刀输入,0.0625 刀缓存,5 刀输出,和它的能力完全不匹配。
  19. Flex 层 GPT-5-High(未 504)消耗参考案例:Kilo Code 中对我的一个项目仓库进行从头分析,积累上下文58.6k,消耗 0.8 刀。

大概就这些吧,希望能帮到各位佬友 :folded_hands:

49 个赞

这里的能再详细讲讲吗

4 个赞

我知道的也就这么多了 :joy:
mini 是 horizon 我是比较确定的,因为我在那几天高强度玩了 horizon,mini 和它几乎一模一样。但后面那个我不确定,我是听人说的,但是 High 比没有 High 确实强不少

2 个赞

这么看起来还可以啊,oai还是有点东西

2 个赞

真的是,我都没想到 openai 有一天会和性价比沾边:rofl:

1 个赞

我记得看过几个评论说 GPT-5-High 容易吃满上下文
GPT-5-Medium 反而能达到性能与上下文消耗的平衡

2 个赞

我用下来感觉 high 的上下文消耗还行

2 个赞

价值连城的实际经验,感谢佬分享!

3 个赞

就我的感觉,如果你的主要场景是科研的话,gpt5应该是最佳的,数学逻辑能力很强。gpt5-mini基本可以平替claude4,可以试试copilot,现在免费。工具使用基本与claude差不多,细节把控更强些。

3 个赞

GPT5确实越用越好用,可惜我api过kyc失败了 :tieba_009:

2 个赞

:ox:啊,四点多就起来发帖了

2 个赞

3.除了 Google 其他家 AI 产品(Claude、OpenAI)均不允许大陆 / 香港发卡行发行的 VISA / MasterCard。本质上 Google 的 AI 服务也明确不支持大陆和香港使用,但是现在没在付款方式上卡。
6.看账单地址
11.不支持
13.当然… 怎么可能扣两次
16.这个模型工具调用能力很不错,可以当便宜 agent 模型来用
18.一般来说不会影响模型(至少目前没有显著的证据),这个只是提示词有变化(影响 system 中的 juice),模型做过针对性训练,和开源的 oss 那种差不多,但 juice 应该控制粒度更细

补充几点:


  1. 多轮对话和 agent 应用推荐使用 Responses API,GPT-5 系列用 Responses API 的缓存命中率很高,而且可以避免很多重复思考
  2. GPT-5 系列支持了一个新的参数 verbosity,在 Cherry Studio 上体现为左侧设置栏里的“详细程度”,这一点可以更改模型返回(非思维链)的详细性,如果喜欢简洁的可以改成 low,喜欢事无巨细(也包含废话的)可以选 high。不过目前 Cherry Studio 有 bug ,这个选项仅在使用 Responses API 时生效
  3. 默认情况下 GPT-5 系列 API 返回纯文本(plaintext)样式,如需 Markdown 样式的代码块和公式可以在系统提示词加入下列可选说明:
1. 使用 `...` 包裹行内代码,
```
...
```
包裹块(行间)代码

2. 使用 $...$ 包裹行间(inline) 公式,
$$
...
$$
包裹块(block) 公式。
  1. Azure 的渠道的 GPT-5 似乎在响应延迟上不如官方渠道稳定
9 个赞

谢谢分享

2 个赞

感谢佬的分享

2 个赞

感谢大佬。

2 个赞

怪不得有的转发站 gpt-5-high 比别家慢那么多,是不是偷偷加 service_tier 又不告诉用户 :tieba_016:

2 个赞

感谢大佬分享

2 个赞

gpt-5-high 是真的很强,这次的 GPT-5 一定要记得设置这个 reasoning_effort,能 high 就 high

不知道这都是从谁开始说的,大家都认为GPT-5只是一个模型选择器?

当然,从逻辑上推,那这位大佬说的倒也没什么问题,毕竟如果按照原本的命名结构,GPT-5的Reasoning系列其实就是o4-series

3 个赞

佬友平时用的网页端还是API?

2 个赞

事实是,低价API很有可能都不是OAI官方platform,而是薅的azure

1 个赞