……已经麻了,不想说啥了,说好的「任何领域PhD级别呢」,这PhD级别难道指的是美国大学中文系学生的PhD写作水平?
说句题外话(其实不算跑题):R2什么时候?以及我怀疑是不是所有的RL训练出的模型都这样一股子味道……
欢迎各位找出你认为「味道」最重的段落~
……已经麻了,不想说啥了,说好的「任何领域PhD级别呢」,这PhD级别难道指的是美国大学中文系学生的PhD写作水平?
说句题外话(其实不算跑题):R2什么时候?以及我怀疑是不是所有的RL训练出的模型都这样一股子味道……
欢迎各位找出你认为「味道」最重的段落~
量子邮局这个我怎么感觉在哪里看过。。。
RL磕多了对齐不做好就这样 ![]()
嗯……R1特别喜欢量子,也许?
DeepSeek特有的量子力学 ![]()
另外,个人认为最味的是:
【现实补刀】:我们在五楼
就我不好描述我的感受,但感觉GPT-5写这一段的时候的表情是这样的: ![]()
![]()
可能是美國大學物理系學生的PhD寫作水平 ![]()
虽然早有预感,但是点进来看到标题之后还是笑得我 ![]()
看到量子就绷不住了
一眼丁真,量子 ![]()
蒸馏了deepseek吧
ds,o3的疯癫文风
请教一下大佬,为什么ai会有这种类型的幻觉啊?一直听别人说是没对齐导致的,到底是什么意思呢?
业内一直不确定到底这种现象是蒸馏了DS R1的语料,还是他们所共同使用的思考模型的训练模式就是会导向这种文风。
deepseek风格
这下悬着的心总算是似了 实测下来gpt5 thinking的写作能力大概从o3/o3pro的幼儿园大班水平提高到了小学一年级(
为啥Gemini2.5pro的写作能力能断崖式领先
比R1还是好点,R1写小说容易堆砌细节
4.5的写作能力没法喷,确实高,但是5……给我的感觉就是一个100B左右的小模型,反正模型大小不大
好像gpt 5的写作能力大幅下降了,取而代之的是编程能力提高