【gpt-4o-0326】250329更新：免费会员上线原生画图了！Aider编程评分

dwqxq1 · 2025 年3 月 28 日 12:16

gpt-4o-250326除了增加了原生图像功能，基础性能也增加了

老话说得好：新三年，旧三年，缝缝补补又三年

正统接班人4.5败家子，不争气啊，付不起来的阿斗，老爸4o没法退休，修修补补再抗几个月，直接等孙子5.0(o3)接班吧

lmarena评分

来源：https://lmarena.ai/

Livebench评分

来源：https://livebench.ai/

Artificial Analysis评分

来源https://artificialanalysis.ai/

Aider编程评分 250329 19:00更新

来源：Aider LLM Leaderboards | aider

4o原生图像的谷歌搜索热度 240328更新

cat3399 · 2025 年3 月 28 日 12:17

这么强？

SCzheng · 2025 年3 月 28 日 12:18

这个榜单参考价值没那么高.参考这个:

yangtb2024 · 2025 年3 月 28 日 12:19

太假了，claude甚至排那么后面

KXG · 2025 年3 月 28 日 12:20

OpenAI 的运行逻辑被我扒出来了！

void OpenAI() {
    while (true) {
        int rank = check_openai_model_rank_in_lmarena();
        if (rank != 1) {
            publish_model(new_model);
        }
        sleep(random(3, 7) * day);
    }
}

Jason_ghost · 2025 年3 月 28 日 12:20

连续3天，3家出模型

wwow · 2025 年3 月 28 日 12:21

可以酒馆吗

pengzhile · 2025 年3 月 28 日 12:22

4.5是大模型基模，4o属于蒸馏的那种，所以等一波4.5o

fable · 2025 年3 月 28 日 12:22

azure上了嘛，我看还是2024-10啥的

kryptos42 · 2025 年3 月 28 日 12:25

想知道目前
claude3.7(thinking)
gemini2.5
gpt4o
之间该如何抉择？

handsome · 2025 年3 月 28 日 12:31

早就做好了一直不发呢吧

dwqxq1 · 2025 年3 月 28 日 12:34

估计原生图像和新版4o，早做好就等给google捣乱呢

claude只是编程和写作强，其他多模态/语音/深度研究/画图/视频/联网/c端占有率都弱，也看不出来有全面发展的野心，程序员在所有人群中占比不足1%，对openai构不成威胁。google市值是openai的十几倍，gemini会是chatgpt"一生的敌人"，google有足够资源和动机死缠烂打到底，所以openai专门与google对着干，抢风头，也是有心可原

google几乎每次发新品，都被openai精准狙击，卡时间，抢头条

其实2.5pro的用途，远比4o原生图像用途广泛。但耐何openai会作秀，图像的传播性也好，这几天普通用户大部分注意力都被吸引到原生图像上去了

比如youtube上介绍原生图像的视频，就远比2.5pro多

OpenAI_Q-Star · 2025 年3 月 28 日 12:43

感觉 4.5 是多回训练
4o是由旧“结构”蒸馏到”新“结构？

fengchris · 2025 年3 月 28 日 13:00

这个榜刷来刷去都还不如claude sonnet实战稳

EDWINCHENC · 2025 年3 月 28 日 13:01

gpt-4o和chatgpt-4o啥区别

thereisnospoon · 2025 年3 月 28 日 13:01

卷起来，越卷越好

jondy · 2025 年3 月 28 日 13:01

最好都去用gpt，别抢我gemini算力

Coker · 2025 年3 月 28 日 13:06

⁣͏͏⁣͏͏͏͏⁣͏͏͏⁣⁣⁣⁣⁣͏͏⁣⁣͏⁣͏⁣͏͏⁣͏͏͏⁣⁣͏͏⁣⁣⁣⁣͏⁣͏͏⁣͏⁣⁣͏⁣͏⁣͏͏͏͏͏⁣͏͏⁣⁣͏⁣͏⁣⁣͏͏⁣͏͏͏⁣⁣͏͏⁣⁣⁣⁣⁣͏͏⁣⁣⁣͏⁣⁣⁣͏͏⁣⁣⁣͏⁣͏͏⁣⁣͏⁣͏⁣⁣͏͏⁣͏⁣͏⁣͏͏⁣⁣͏⁣⁣⁢chatgpt-4o-latest 和 claude 3.7 混着用，体验都挺好的

zxx1408 · 2025 年3 月 28 日 13:15

没有区别呢每次模型的更新后，在竞技场上重新评分，就会带上时间编号来进行区分啦

XiaoHuang · 2025 年3 月 28 日 13:16

？？？？！

话题		回复	浏览量
:fire:【大模型系列11】关于Grok4，你想知道的一切。250716更新：LMArena评分，网页版支持语音，加入类似3d waifu 文档共建人工智能 , 纯水	76	3626	2025 年8 月 10 日
:fire:【大模型系列18】关于GPT-5.2，你想知道的一切【251217底楼更新LMArena分数】文档共建 OpenAI , 人工智能 , 纯水	59	3431	2025 年12 月 23 日
gemini-2.5-pro疑似正在推送中前沿快讯人工智能	117	1542	2025 年4 月 25 日
:fire:【原创长文】关于Claude4，你想知道的一切，250529更新Lmarena前端编程评分【长期更新】文档共建人工智能 , 纯水 , 原创	70	3190	2025 年7 月 5 日
genspark改成积分制前沿快讯人工智能	62	1067	2025 年5 月 1 日