GPT-4o上下文窗口比GPT-4 Turbo 强。

chawaa · 2024 年5 月 25 日 02:18

如题，GPT-4o 处理上下文能力强。

“Needle in a Needlestack”（简称NIAN）是用来测试大型模型（LLM）是否能够更有效地利用前文信息来生成更准确或更相关的回答。

左边是GPT-4 Turbo。右边是GPT-4o。

原仓库在这

基于仓库的更多模型对比测试：

可接受各种反驳跟评，有测试数据更好，开放题。

handsome · 2024 年5 月 25 日 03:52

怎么会呢，我感觉4turbo强啊

chawaa · 2024 年5 月 25 日 04:05

仅单方面上下文处理能力测评，不是模型整体能力。

这里的GPT-4o 取得进步指是利用前文信息能力的进步。

识图能力 GPT-4o 也很在线。

chat1 · 2024 年5 月 25 日 04:07

gpt是哪个系列的模型最强

chawaa · 2024 年5 月 25 日 04:11

这个介绍很到位。GPT-4 Turbo 定义是高智模型。

lueluelue · 2024 年5 月 25 日 05:04

据说4o会过于看重上文以至于下文有时候都不管用

handsome · 2024 年5 月 25 日 05:22

这就用4o玩猫娘？

TAO_MI · 2024 年5 月 25 日 05:35

强太多大可不必，我经常用4O去改代码，改来改去就那几个问题都解决不了，我把问题跟他重复了3~4遍，那个问题就一个功能都解决不了，但是我重新开一个对话窗口就立马可以解决。。

delph1s · 2024 年5 月 25 日 05:58

重新对话解决99%

xico · 2024 年5 月 25 日 06:06

也不是不行，就是4o想象力不如4-turbo

chawaa · 2024 年5 月 25 日 06:19

重开窗口解决，GPT-4 Turbo 也是这样。

yeahow · 2024 年6 月 6 日 03:56

确实感觉到了这方面它比其他模型强，特别是前天官网崩了我换其他大模型用时感觉很明显

neo · 2024 年8 月 29 日 06:04

From #develop:ai to 资源荟萃

话题		回复	浏览量
佬们经实际测试比较GPT4o和GPT4.0最正宗版的区别！资源荟萃 ChatGPT , GPT-4o , 人工智能	16	7962	2024 年12 月 9 日
现在GPT-4 turbo真的没有存在的意义了吗？资源荟萃人工智能	36	1049	2024 年12 月 9 日
gpt-4o和gpt-4谁强一点？开发调优 ChatGPT , OpenAI , 人工智能 , 快问快答	11	822	2024 年11 月 17 日
GPT4o似乎改进变得更强了一点！资源荟萃 ChatGPT , 人工智能	10	777	2024 年12 月 9 日
刚发现，lmsys的大模型排名，GPT-4o霸榜了，奇怪了资源荟萃 GPT-4o , 人工智能	34	1769	2024 年12 月 9 日