对比看来感觉qwen3-max-thinking完全是走错了路子
比成本比不过deepseek、1T参数,结果比知识量也比不过gemini
然后又没有多模态……
各方面都很平庸,就导致这个模型完全找不到应用场景(反正我是没找到)
个人观点:后续模型发展会越来越分化,大而美一模通吃的时代结束了,各家厂商都得想办法找自己的落地场景,不止是应用落地,而是在模型训练阶段就要想好这个模型炼出来干什么
我感觉通义这波应该是踩坑了,这个模型调用量可能不会多好看
各个山头都被占领了,低成本deepseek凭借DSA遥遥领先,671B的模型1M输入才2¥……这怎么比?编程方面minimax、glm都在发光发热,再往上还有Opus和Codex、Gemini三座大山
我感觉国产未来,DEEPSEEK\GLM\M2系列还行,其他的看把,KIMI反正很多时候用起来不如豆包(非编程),编程场景KIMI属于完全没法用,指令遵循巨差,属于开头就开始差,GLM4.7再怎么样人家能完整跑完,KIMI我每次测试都跑不完,K2.5我昨天试了一下,一样的
真的崩溃,不过起码有多模态了
就这样,qwen3-max 还不是开源的,而且还好意思说自己有希望迈入万亿 tokens 门槛
我只能说KIMI K2.5属于给国产开了个好头 ,未来估计还是被献祭的主,上次K2 THINKING发布也是论坛好多人好厉害,好牛逼,这波国产厉害了,然后呢?2个月了提都没几个提,用就更没人用了,日常讨论最多还是GLM4.7 + M2.1,为啥?因为不好用啊,一用一个不吱声
跟GEMINI 3比上下文,跟QWEN3比好用,属于欺负傻子和欺负智障 ![]()
有体面一点的赢法么 每日一赢 ![]()
开始发力宣传了,但是市场会教育企业,不好用就是不好用,就像QWEN3一样,阿里再怎么宣传,不好用还是不好用
每次出来都是爆杀,结果没长期用过![]()
次次SOTA,次次被献祭的主 ![]()
内建搜索能力了吗?不太用国产模型API就是因为没有内建搜索。
狼来了属于是
有你也不会想用的,百度作为国内搜索引擎top1,你用的多吗
开源模型,有没有内建搜索反而不重要吧?内建搜索可能质量反而不太行,我一般配合CherryStudio搭配tavily使用
这能说明啥这个
也有道理
啊,搜索能力这么强吗
千问的广告打的是负效果,B站我看个视频都一堆商单,纯忽悠小白的
搜索能力确实有提升,之前搜索结果会弹出来然后很慢,现在把搜索结果给隐藏,给人的体感会好很多,之前有种搜索+总结结果 不像大模型
对极了QQ
我也是这个感觉,kimi这家公司从gpt4时代开始出来宣传的就是秒杀gpt4,然后每次发布新模型都投一堆广告次次都是秒杀当时的sota模型,然后我应该在k2的时候信了某些测评充值了测了一下发现不是那么回事..后来就没有再继续充值过,除了之前0.99活动时又冲了一个月体验了下发现也和宣传能力有出入..这次又是熟悉的秒杀gpt5.2和opus,只能说宣传有点夸大..
