花里胡哨的,一会儿4o,一会儿o3,一会儿又o1的
4 个赞
数字+o代表多模态系列
o+数字代表深度推理系列(虽然也包含多模态功能)
9 个赞
原来如此,佬一语惊醒梦中人了
1 个赞
所以多模态是个啥意思呢
1 个赞
就是一个模型能同时处理图片,视频,文字这些的吧
4o 的 o 表示 Omni(全能的,4o 连 realtime 都支持)
o1 的 o 有人说是 Optimize(所以表示推理模型)
4.1, 4.5 才是最让人无语的(4.5 < 4.10)
2 个赞
好呢,感谢
就是感觉有点怪怪的,不如gemini的清晰,推理加个thinking就是了
区别于传统只能输入输出纯文本的大模型(例如早期的gpt3),可以支持图像等非文本输入
1 个赞
这个倒是能区分开了
深度推理的概念一开始也是openai带火的,先推出了o1,其他家才开始跟进。比如kimi的k1,ds的r1
1 个赞
非多模态只支持文字,以前的时候多模态多支持了个图片,后面视频音乐这些也支持了
原生多模态是训练的时候就是连续的多模态信息
非原生多模态是在基础单模态模型上通过添加视觉编码器实现的多模态,一般性能不如原生
2 个赞
太牛了佬
从名字可以看出一个团队管理的问题
目前只有gemini做到了见名知意,且版本号不会倒退
2 个赞
起码gemini能通过名字一眼知道孰强孰弱,虽然chatgpt经过解释也能有结果,但是真的增加障碍
哈哈哈,第一次看到你这个解释,原来还能这么看的
懂了,OpenAI是用AI起的版本号
1 个赞
这就是是团队管理混乱,胡乱起名字,太随心所欲
1 个赞
还是喜欢以前O1,现在O3说话方式太激进了,没点知识背景很可能看不懂说的啥。
1 个赞




