早上醒太早,浅测了一下 Qwen Code

任务背景

之前使用 Gemini + Claude Code 制作了一个帮助我做锻炼纠正体态问题的一个网站,大概就是下面的样子

最近上班之后感觉长期久坐很难受,遂希望在锻炼环节中加入一些与颈椎、腰背相关的锻炼内容,来进行每日的放松,正好 Qwen 推出了最新的编码模型与二开的 Qwen Code,遂尝试了一下其效果

测试环境

OS: Windows 11 24H2 26100.4652
API Provider: ModelScope (魔搭社区)
Model: Qwen/Qwen3-Coder-480B-A35B-Instruct

测试任务

一、代码阅读与任务理解

第一个任务就是要求 Qwen Code 对代码仓库的已有代码进行阅读与分析,结合 git commit 日志分析代码变更,并允许其制作复制文件辅助编码

在这个任务中 Qwen3 Coder 展现出了很强代码阅读能力与相当迅速的响应能力,因为其并非推理模型,首字响应速度比起 G2.5Pro 快了许多,同时魔搭提供的API推理速度也很快,体感 40 token/s 的样子

但是 Qwen 在第一轮交互中也是犯了很多 LLM 都会产生的问题,因为阅读了大量的英文代码,遗忘了用户初始的交互语言是中文,因此输出了大段的英文回复,考虑到并没有在 System Prompt 中指定回复语言,这个问题可是说是无伤大雅

二、需求理解与页面改写

第二个任务就是核心需求,在已有的健身指导页面中加入新的内容,并与已有的锻炼内容做结合,我的具体提示词是

这个是我之前写的一个用于体态纠正的锻炼计划的页面,现在我上班之后,除了纠正体态的需求,还因为每天的久坐身体很不舒服包括腰背与颈椎,请你尝试在锻炼计划中融入一部分有利于我缓解久坐的项目,并对原来的项目进行适当的调整以控制一次锻炼的总时长不会有太大变化

得益于魔搭社区的快速响应能力,编码任务在78s内就全部完成了,Qwen3 Coder 准确地根据用户的需求制定了新的训练计划,并在已有的页面上进行了修改与整合,最终页面效果如下

代码一次通过,并且我检查了其自查环节,在其自查过程中也没有出现任何错误,这说明其遵循编码规范的能力还是比较强的。
经过对最终页面的人工审查,发现 Qwen3 Coder 比较好地将新的内容加入了原本的页面,并且保障了元素和动效的一致性,合理利用了之前代码中存在的样式表,没有额外造轮子,并且整个锻炼流程也是可以正常进行,没有任何的问题

三、git 相关操作

最后一个任务是 git 提交,我要求 Qwen3 Coder 进行代码的 git 提交并详细记录变更西信息
在这一步中,Qwen 遇到了不小的麻烦,进行了多次的重试

整个提交过程尝试了大约 9 次 才成功完成,根本原因是其在 Windows 命令行下的一些指令没有正确使用,在Windows的命令行中,当使用双引号包围提交信息时,git无法解析这些引号,导致将引号内的每个单词都当作独立的路径参数来处理

但是直到最后,Qwen 也没有找到正确的提交指令,最终使用了一个替代方案来解决问题,它将提交信息写入了一个临时文件,然后使用 git commit -F 从文件中读取提交信息,完成了最后的 commit

小结

我个人最终对 Qwen3 Coder 的评价如下
代码理解能力: :star::star::star::star::star: (5/5) (希望 Qwen 不要太骄傲这只是最基本的一环
需求理解与实现::star::star::star::star::star: (5/5)
响应速度::star::star::star::star::star: (5/5) (这个应该是体验下来非常好的一环,相比于 cc 的时不时断连,gemini 的超绝长考,qwen 的响应速度是让人耳目一新的尤其是我这个急性子
多语言交互::star::star::star: (3/5)
系统指令能力::star::star: (2/5) (本次体验中最浪费时间,也是让人体感最差的一环

总体来说 Qwen3 Coder 很适合做一些简单的编码任务,其代码理解能力、响应速度与编码规范都是位于业界的第一梯队,但是需要仔细检查其系统操作,在某些特定场景下需要人工帮助

附录

魔搭 API 设置指引

在项目根目录下创建 .env 文件并输入以下环境变量

OPENAI_API_KEY="你在 ModelScope 的 API KEY"
OPENAI_BASE_URL="https://api-inference.modelscope.cn/v1/"
OPENAI_MODEL="Qwen/Qwen3-Coder-480B-A35B-Instruct"

魔搭提供了每日2000次的推理次数,对于我来说基本是够用了

统计数据

  • 总耗时: 37分22秒
  • 智能体活跃时间: 10分33秒
    • API 调用时间:7分4秒 (67.0%)
    • 工具执行时间:3分29秒 (33.0%)

工具调用表现:

  • 总调用次数:32 次
  • 成功次数:32 次 :check_mark:
  • 失败次数:0 次 :multiply:
  • 成功率:100.0%

Qwen/Qwen3-Coder-480B-A35B-Instruct 使用详情:

  • 请求次数:76 次
  • 输入Token总量:615,778
13 个赞

好用爱用,一次性添加了6个文件(每个差不多2000行左右),成功修改并应用了3个文件中的5处函数。附上我的aider模型配置(PS:480B还是太大了希望有更小尺寸的在本地用)

1 个赞

单纯API的价格怎么样

这个不能放在终端环境变量里面吗,如果只能放在项目的配置文件里,岂不是不能随意到处code了?

自己也在复杂项目用了用,可能是用的gemini cli改的,右侧一直提示error 跟play.google.com链接不上,不过不影响使用。
在代码表现上,跟gemini pro有类似的多改的现象,要帮我启动后端,发现8080端口占用,直接给我把配置文件改成8081端口,强制启动。
关于变量的问题,直接export全局能读到就成,没测是否会影响gemini cli
export OPENAI_API_KEY=“your_api_key_here”
export OPENAI_BASE_URL=“https://api-inference.modelscope.cn/v1/
export OPENAI_MODEL=“Qwen/Qwen3-Coder-480B-A35B-Instruct”

是使用 Claude Code 配置 Qwen3 Coder 的 api 来使用的吗?
对比 claude 的模型哪个更强?

Openrouter 的供应商定价列表

是 Qwen 官方魔改的 claude code,叫 Qwen code,支持 OpenAI 兼容格式
估计开源模型还是比不上claude 不过定价便宜点

应该是改的gemini cli claude code没开源呢~

嗷嗷是的 感谢纠正~

真的很希望有开源32B的 :tieba_087:


魔搭的2000次,必须要绑定阿里云账号才能用吗

是的 要绑的

会不会自动扣费啥的

不会的,你在魔搭甚至看不到模型定价(

1 个赞

感谢解答

1 个赞

不知道是 cli 工具不显示输出还是咋,感觉好慢