如题,GPT-4o 处理上下文能力强。
“Needle in a Needlestack”(简称NIAN)是用来测试大型模型(LLM)是否能够更有效地利用前文信息来生成更准确或更相关的回答。
左边是GPT-4 Turbo。右边是GPT-4o。
原仓库在这
![]()
基于仓库的更多模型对比测试:
可接受各种反驳跟评,有测试数据更好,开放题。
如题,GPT-4o 处理上下文能力强。
“Needle in a Needlestack”(简称NIAN)是用来测试大型模型(LLM)是否能够更有效地利用前文信息来生成更准确或更相关的回答。
左边是GPT-4 Turbo。右边是GPT-4o。
原仓库在这
![]()
基于仓库的更多模型对比测试:
可接受各种反驳跟评,有测试数据更好,开放题。
怎么会呢,我感觉4turbo强啊
仅单方面上下文处理能力测评,不是模型整体能力。
这里的GPT-4o 取得进步指是利用前文信息能力的进步。
识图能力 GPT-4o 也很在线。
gpt是哪个系列的模型最强
据说4o会过于看重上文以至于下文有时候都不管用
这就用4o玩猫娘 ?
强太多大可不必,我经常用4O去改代码,改来改去就那几个问题都解决不了,我把问题跟他重复了3~4遍,那个问题就一个功能都解决不了,但是我重新开一个对话窗口就立马可以解决。。
重新对话解决99%
也不是不行,就是4o想象力不如4-turbo ![]()
重开窗口解决,GPT-4 Turbo 也是这样。
确实感觉到了这方面它比其他模型强,特别是前天官网崩了我换其他大模型用时感觉很明显
From #develop:ai to 资源荟萃