大模型看似多,其实真正能用的也就这么七八家

最近很多佬都在各种不同的大模型之间跑来跑去,感觉仿佛有看不完的大模型,看不完的更新。一个任务往往都不知道交给哪个大模型做。

大模型虽然多,但其实真正值得使用的,也就这么几家。

1、Deepseek。过去一段时间有点摆烂,但是底蕴犹存。25年一月爆火于全世界。中文的一些回答质量还是很高。我们现在公司很多人,没有VPN优先用的就是Deepseek。

2、Gemini。谷歌家。谷人希——谷歌是人类的希望。少数通过TPU训练的模型。Flash的速度足够快,可以用来进行一些翻译。使用的口子很多,AIStudio、Gemini、搜索的入口点AI。在Gemini-Terminal中也可以用,但是解决代码稳定性还是不如Claude。单页面生成这块确实很强。AIStudio是最好用的,很长的上下文窗口+免费,我一般长期战略规划都和Gemini聊。另有神器,banana pro。旗下imageFx也很值得体验。

3、ChatGPT。免费额度有限。非思考模型速度快。Pro模型速度有点慢。对于搜索网络信息,提供引用,绘制数据图表,这块断崖式领先。Sora2是神。Team的$1跟车的口子现在还有。Codex被其编程插件拖累了,显著不如Claude code。语音模式断崖领先其他家,可用于翻译纯英语交流等。目前市占率最高。

未完,回帖里继续

28 个赞

基本上写代码用 Claude、GLM, 读文档或者注释代码用Gemini、ChatGPT,手机上生活常识用Deepseek。

11 个赞

4、Claude。Claude的现在编程的体验还是断崖领先。尤其是Claude code其编程体验还是遥遥领先了其他家。指令遵从,方案成熟度这几块我选Claude。网页版首先提出了Airfact、Project等概念。现在网页版流量已经显著下滑。基本没有太多人用。站内有很多这些API的中转站。若你用Cursor,这是Cursor的首选模型。别看Gemini3浓眉大眼,Codex吹得很牛,真写代码生产力还是靠Claude code。

5、Grok。瑟瑟平台。但是Grok近期有洗白自己的倾向,那种事情不要啊。打榜实力仍旧不错。各方面均不出众,陪跑者。

6、豆包。小白用户的最常用APP。C端流量最高。页面加了一些吸引小白的没什么用的功能(例如电话)。但是不得不说,文生图水平并不低。里面也有写代码等。不是不好用,但是你看站内为什么基本没有人用呢?核心还是小白用户和专业用户的区别。另有扣子等平台,粗略体验过,暂不评价。

这个插一句嘴,豆包做电话聊天这个,上B站看,有很多人把和豆包电话聊天当情感寄托。严格来说,这并不是专业使用领域,而是纯粹的情感陪伴领域。Ps:即梦不可小觑。

7、Qwen。这段时间疯狂营销。阿里的老毛病,捧着金饭碗要饭。开源领域的神。这段时间阿里内部整风,合并了很多大模型,通义C端口子并入Qwen下,看后续走的怎么样。但即便如此,现在阿里内部我随便都可以说出三个牌子:千问、夸克AI、灵光。Qwen-code暂不值得体验。Qwen回答质量怎么样,我评价是,不低。但是目前来看,还做不到有某方面的特色。可以和Deepseek互为替代吧。通义万象很牛。

8、另外是两家小的。MiniMax、智谱。目前来看,按照Deepseek的摆烂(或者是憋大招)下一步爆火的可能是MiniMax,MiniMax在商业化方面很努力,其Agent我高度认可。智谱我评价是有实力,还要观察。至于Kimi,当前可忽略。

3 个赞

感谢指引,对新手很重要

不过其实一个模型就可以满足基本所有的需求了吧,我不搞编程,用gpt就够用了,用太多模型感觉很麻烦

海螺应该第一梯队了吧

Deepseek 写小学生作文真的强, 我孩子用他生成作文,文笔很厉害,被我一眼识破

6 个赞

ds就是有点词语堆砌的感觉

小学作文是个模型不都行

写代码优先 claude ,chatgpt,没其他了

1 个赞

收藏了,很有指导作用

写nsfw的文本是不是只能grok?gemini 可以调教不

openai

GPT 5, GPT 5.1, GPT 5.1 Codex

anthropic

Claude Opus 4.5
Claude Opus 4.1
Claude Sonnet 4.5
Claude Sonnet 4

other

Kimi K2 Think
GLM 4.5, 4.6
Minimax 2.0

开源认模型,闭源认应用
有很多可以用

对我而言速度大于质量,cerebras的glm4.6简直无敌,轻轻松松500token/s,窜稀窜的快也是一种质量,抽奖抽的飞快

2 个赞

我倒是觉得qwen的文本向量和rank模型其实比目前市面上这些要强不少,再就是wan作为开源图片和视频生成模型一直属于头部状态

1 个赞

速度很关键,大模型不是所有场景都在解决深度思考的问题,快速回复也是一个很重要的理由。

即便是写代码,我们也不希望代码写太久。

我经常用Aistudio替代我批量阅读文本,微信群消息,书本等

写代码,Claude GPT呗

当然可以,我玩涩涩都用gemini ,grok毕竟不强(API不好搞)
包括最近的gemini-3-pro ,也容易破甲

1 个赞