注意 grok-3-mini 的响应字段

zhong_little · 2025 年4 月 10 日 11:04

grok-3-mini 为思考模型，但引入了新的 usage 格式，completions_tokens 只统计非思考的回复内容长度：

"usage": {
    "prompt_tokens": 32,
    "completion_tokens": 10,
    "total_tokens": 299,
    "prompt_tokens_details": {
      "text_tokens": 32,
      "audio_tokens": 0,
      "image_tokens": 0,
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "reasoning_tokens": 257,
      "audio_tokens": 0,
      "accepted_prediction_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  },

其中，

total\_tokens = prompt\_tokens + completion\_tokens + reasoning\_tokens

然后你就可能发现，你部署的中转计费好像和官方统计数据对不上，尤其是你启用 high 思考的时候，几万的 reason_tokens 是被中转统计忽略掉的，所以如果你发现用量消耗对不上，别急着担心秘钥被偷了，也可能只是这个原因

简单统计一下几个推理模型的 token 计数：

模型	是否公开思维链	响应字段	响应计数	是否支持调节推理长度
o1, o3 系列	No	分成：input_tokens 和 output_tokens (包含 reasoning_tokens)	total= input+output	Yes
deepseek	Yes	分成： prompt_tokens 和 completions_tokens (包含 reasoning_tokens)	total = prompt + completions	(暂未上线)
grok-3-mini	Yes	分成 prompt_tokens, reasoning_tokens 和 completion_tokens	total = prompt + reason + completion	Yes

Throttle · 2025 年4 月 10 日 11:05

还能这样

voi · 2025 年4 月 10 日 11:52

newapi调用mini时，如果设置high思考啊佬

zhong_little · 2025 年4 月 10 日 11:55

客户端如果不支持设置的话试试 newapi 这里的参数覆盖：

ste124mbridge · 2025 年4 月 10 日 12:27

最新版newapi已经可以在后面直接加-high了和o1一样。
reason_token也计费了

lueluelue · 2025 年4 月 10 日 12:38

还有grok3 mini了？这个也能思考吗哈哈哈

6512345 · 2025 年4 月 10 日 12:40

3 mini是思考模型w

taobao · 2025 年4 月 10 日 12:41

可以思考的

taobao · 2025 年4 月 10 日 12:42

lueluelue · 2025 年4 月 10 日 12:44

哇去那是不是很值

lueluelue · 2025 年4 月 10 日 12:45

啊？mini才是推理吗？那grok官网的推理也是mini吗怪不得这么快

taobao · 2025 年4 月 10 日 12:45

还可以目前还在送150

taobao · 2025 年4 月 10 日 12:45

mini是推理而且价格更便宜不到一美元

算力太充足了

lueluelue · 2025 年4 月 10 日 12:45

grok官网的推理也是mini嘛

taobao · 2025 年4 月 10 日 12:46

不太清楚

我感觉是think的 think速度和这个差不多回复结构也很像

taobao · 2025 年4 月 10 日 12:47

目前用主要是价格便宜速度还快

lueluelue · 2025 年4 月 10 日 12:49

OKOK！感谢！

jerry_wu · 2025 年4 月 10 日 12:58

我觉得应该是，因为我在 grok3 刚出的时候问过模型，他说 thinking 就是 grok3mini，过一段时间他又说自己不清楚，估计就是不想提这茬

lueluelue · 2025 年4 月 10 日 12:58

怪不得thinking这么快啊

system · 2025 年5 月 10 日 12:59

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。

话题		回复	浏览量
grok3-mini/grok3 livebench 得分搞七捻三人工智能	32	914	2025 年5 月 13 日
Grok3 API问题请教开发调优人工智能 , 快问快答 , 纯水	21	772	2025 年5 月 11 日
猜想：官网Grok-3-thinking、Deepersearch都是Grok-3-Mini，真正的Grok-3推理版并未发布，应该是Grok-3.5 开发调优人工智能	33	1290	2025 年5 月 15 日
【搬运评测】Grok-3 Mini强得过分：在知乎大佬推理测试中接近满分，超过了Claude 3.7 Sonnet-Thinking 开发调优人工智能 , 转载	70	2496	2025 年5 月 16 日
X AI 新的模型区别是啥搞七捻三人工智能	23	464	2025 年5 月 11 日

注意 grok-3-mini 的响应字段

相关话题