Gemini 2.5 API生成回复好慢啊

用API调用比AIstudio慢了好几倍
但是感觉回复质量比AIstudio要高呢,是我的错觉么

gemini 2.5Pro的最佳食用方式是什么?

1 个赞

api没有思考过程所以你才看着慢 而studio有

2 个赞

因为这个是推理和非推理的混合模型,在认为你的问题需要推理的时候,速度就变慢了

那是claude 3.7sonnet,而且也不是这样混合的,2.5pro就是思考模型,但api返回的是不包含think的,所以才慢

2 个赞

我觉得 2.5 pro 相比于其他思考模型算快的了

可能是因为一大段一大段的所以感觉慢?

跟 o1 一样,不给看思考过程,所以要等它思考部分生成完了才开始吐字

不会啊,我感觉速度挺快的

用流式请求就可以了,一般思考不会超过30秒,差不多思考完毕就会流式输出了。

如果非流式请求,那么要等所有的都生成完毕才会输出,那估计需要30-60秒才行。

我发现是openrouter慢,不是google api慢。
我直接调用谷歌官方的,速度很快。

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。