GPT 5 小说实测：我不说像谁

earmer · 2025 年8 月 7 日 18:08

……已经麻了，不想说啥了，说好的「任何领域PhD级别呢」，这PhD级别难道指的是美国大学中文系学生的PhD写作水平？

说句题外话（其实不算跑题）：R2什么时候？以及我怀疑是不是所有的RL训练出的模型都这样一股子味道……

欢迎各位找出你认为「味道」最重的段落~

cnm · 2025 年8 月 7 日 18:12

量子邮局这个我怎么感觉在哪里看过。。。

3GZ · 2025 年8 月 7 日 18:12

RL磕多了对齐不做好就这样

earmer · 2025 年8 月 7 日 18:12

嗯……R1特别喜欢量子，也许？

Shikha · 2025 年8 月 7 日 18:13

DeepSeek特有的量子力学

earmer · 2025 年8 月 7 日 18:15

另外，个人认为最味的是：

【现实补刀】：我们在五楼

就我不好描述我的感受，但感觉GPT-5写这一段的时候的表情是这样的：

kooo13579 · 2025 年8 月 7 日 18:22

可能是美國大學物理系學生的PhD寫作水平

homeworkkun · 2025 年8 月 7 日 22:22

虽然早有预感，但是点进来看到标题之后还是笑得我

SugarBreeze · 2025 年8 月 7 日 22:23

看到量子就绷不住了

MIKUSCAT · 2025 年8 月 7 日 23:12

一眼丁真，量子

Sib · 2025 年8 月 8 日 00:57

蒸馏了deepseek吧

codeboy · 2025 年8 月 8 日 01:18

ds,o3的疯癫文风

kaze · 2025 年8 月 8 日 01:18

请教一下大佬，为什么ai会有这种类型的幻觉啊？一直听别人说是没对齐导致的，到底是什么意思呢？

earmer · 2025 年8 月 8 日 02:23

业内一直不确定到底这种现象是蒸馏了DS R1的语料，还是他们所共同使用的思考模型的训练模式就是会导向这种文风。

apicopilot · 2025 年8 月 8 日 02:31

deepseek风格

dsgafsh · 2025 年8 月 8 日 06:13

这下悬着的心总算是似了实测下来gpt5 thinking的写作能力大概从o3/o3pro的幼儿园大班水平提高到了小学一年级（

dsgafsh · 2025 年8 月 8 日 06:21

为啥Gemini2.5pro的写作能力能断崖式领先

DreamyYeah · 2025 年8 月 8 日 06:26

比R1还是好点，R1写小说容易堆砌细节

earmer · 2025 年8 月 9 日 06:37

4.5的写作能力没法喷，确实高，但是5……给我的感觉就是一个100B左右的小模型，反正模型大小不大

EricOnly · 2025 年8 月 9 日 07:53

好像gpt 5的写作能力大幅下降了，取而代之的是编程能力提高

话题		回复	浏览量
deepseek新模型一股gpt5味…… 搞七捻三人工智能 , 纯水	33	1633	2026 年3 月 15 日
gpt-4.5这么大规模，居然写作被deepseek碾压？（斥巨资玩gpt-4.5........）搞七捻三人工智能	26	1127	2025 年4 月 2 日
gpt 5.1 pro 怎么感觉不像一个模型更像一个agent 开发调优人工智能 , 快问快答	13	453	2025 年11 月 29 日
gpt-5似乎得了一种名为专业的病搞七捻三人工智能 , 纯水	79	2763	2025 年10 月 3 日
近期LLM的观察开发调优人工智能	12	586	2025 年8 月 17 日