o1 API 来了 - OpenAI 12 Days - Day 9

省流

  1. 开放o1 api,支持丰富自定义功能
  2. 开放实时语音api
  3. 支持基于偏好数据的微调

o1 API

提供了比网页版本更多的自定义功能:

  1. 支持函数调用(自定义函数)
  2. 支持结构化输出
  3. 支持自定义提示词
  4. 支持设置resoning efforts,控制消耗算力的多少)
  5. 支持指定instruction hierarchy,控制提示词的跟随优先级

Realtime API

升级了高级语音模式的API,降低了响应延迟和调用费用,支持了WebRTC技术。
(我完全不了解WebRTC,没咋听明白,懂的佬友可以补充一下这东西有啥优势)
根据佬友的补充和网上的资料,WebRTC是一种web端p2p实时通讯技术,基于udp协议和、可以进行自动拥塞控制,使得在网络不稳定时也能进行通话(通过动态调整音频质量)

Preference Fine-Tuning

Day 2发布的微调功能进一步支持了偏好微调的形式(之前是有监督微调和强化学习微调),即:给出一个问题和两个不同的回答,标注两个回答哪个更好。
但我不明白的是,这个偏好微调应该属于强化学习微调的范畴吧?为啥要作为一个独立的训练模式拿出来呢。

另外值得一提的是,偏好微调不支持o1系列模型。


其他

  1. 我真的忍不住要吐槽一下主讲人那个印度口音,我这种听力水平一般的人真的听不清。。。
  2. 他们还发布了新的Go Library

40 个赞

好家伙,可以直接检查税表……美国70万CPA可以下岗了 :grin:

6 个赞

webrtc那个,说人话就是可以在网页上实时通话webrtc是一个主流浏览器都支持的功能,可以发udp包用于实时通讯之类的

3 个赞

拥塞控制,网络不好的情况下动态控制音视频质量

3 个赞

finetune 真的有用么 感觉是个很鸡肋的东西

1 个赞

对个人来说用处不大;对公司来说如果用量大,就可以省很多钱。

Finetune可以在一个很窄的领域内将模型回复提升一个小段位,差不多将4o-mini提升到4o的水平。而微调过后4o-mini仍然是普通4o-mini的价格。对于公司来说,相当于花了100 - 200刀左右微调训练模型,然后就可以在特定领域内用4o-mini的价格得到4o的效果了。

2 个赞

优先Tier 5能使用,暂时和我没啥关系

Realtime API 之前不是就有么?

的确 就是不知道为了实现这样的微调效果 需要有多大的工程量 如果可以有可以遵循的实践 那么对个人的定制化也会有很大的吸引力了

2 个赞

稍微有点用

4 个赞

openai 可以做会计但可以代替老板坐牢吗 :rofl:

3 个赞

确实,这里我弄错了。已修改

不知道openai怎么解决训练效果的问题。据我了解,强化学习是比较难训的,场景不同要调很多次参数。难道他们有什么奇技淫巧可以用一组参数适用所有场景?还是说暴力训很多个模型选最好的?

今天总算拿出点真东西了

此话题已在最后回复的 30 天后被自动关闭。不再允许新回复。