GPT-4o上下文窗口比GPT-4 Turbo 强。

如题,GPT-4o 处理上下文能力强。

“Needle in a Needlestack”(简称NIAN)是用来测试大型模型(LLM)是否能够更有效地利用前文信息来生成更准确或更相关的回答。

左边是GPT-4 Turbo。右边是GPT-4o。

原仓库在这 :point_down: :point_down:

基于仓库的更多模型对比测试:

可接受各种反驳跟评,有测试数据更好,开放题。

5 个赞

怎么会呢,我感觉4turbo强啊

1 个赞

仅单方面上下文处理能力测评,不是模型整体能力。

这里的GPT-4o 取得进步指是利用前文信息能力的进步。

识图能力 GPT-4o 也很在线。

gpt是哪个系列的模型最强

这个介绍很到位。GPT-4 Turbo 定义是高智模型。

据说4o会过于看重上文以至于下文有时候都不管用

这就用4o玩猫娘 ?

强太多大可不必,我经常用4O去改代码,改来改去就那几个问题都解决不了,我把问题跟他重复了3~4遍,那个问题就一个功能都解决不了,但是我重新开一个对话窗口就立马可以解决。。

3 个赞

重新对话解决99%

19 个赞

也不是不行,就是4o想象力不如4-turbo :crazy_face:

重开窗口解决,GPT-4 Turbo 也是这样。

确实感觉到了这方面它比其他模型强,特别是前天官网崩了我换其他大模型用时感觉很明显

From #develop:ai to 资源荟萃

1 个赞