任务背景
之前使用 Gemini + Claude Code 制作了一个帮助我做锻炼纠正体态问题的一个网站,大概就是下面的样子
最近上班之后感觉长期久坐很难受,遂希望在锻炼环节中加入一些与颈椎、腰背相关的锻炼内容,来进行每日的放松,正好 Qwen 推出了最新的编码模型与二开的 Qwen Code,遂尝试了一下其效果
测试环境
OS: Windows 11 24H2 26100.4652
API Provider: ModelScope (魔搭社区)
Model: Qwen/Qwen3-Coder-480B-A35B-Instruct
测试任务
一、代码阅读与任务理解
第一个任务就是要求 Qwen Code 对代码仓库的已有代码进行阅读与分析,结合 git commit 日志分析代码变更,并允许其制作复制文件辅助编码
在这个任务中 Qwen3 Coder 展现出了很强代码阅读能力与相当迅速的响应能力,因为其并非推理模型,首字响应速度比起 G2.5Pro 快了许多,同时魔搭提供的API推理速度也很快,体感 40 token/s 的样子
但是 Qwen 在第一轮交互中也是犯了很多 LLM 都会产生的问题,因为阅读了大量的英文代码,遗忘了用户初始的交互语言是中文,因此输出了大段的英文回复,考虑到并没有在 System Prompt 中指定回复语言,这个问题可是说是无伤大雅
二、需求理解与页面改写
第二个任务就是核心需求,在已有的健身指导页面中加入新的内容,并与已有的锻炼内容做结合,我的具体提示词是
这个是我之前写的一个用于体态纠正的锻炼计划的页面,现在我上班之后,除了纠正体态的需求,还因为每天的久坐身体很不舒服包括腰背与颈椎,请你尝试在锻炼计划中融入一部分有利于我缓解久坐的项目,并对原来的项目进行适当的调整以控制一次锻炼的总时长不会有太大变化
得益于魔搭社区的快速响应能力,编码任务在78s内就全部完成了,Qwen3 Coder 准确地根据用户的需求制定了新的训练计划,并在已有的页面上进行了修改与整合,最终页面效果如下
代码一次通过,并且我检查了其自查环节,在其自查过程中也没有出现任何错误,这说明其遵循编码规范的能力还是比较强的。
经过对最终页面的人工审查,发现 Qwen3 Coder 比较好地将新的内容加入了原本的页面,并且保障了元素和动效的一致性,合理利用了之前代码中存在的样式表,没有额外造轮子,并且整个锻炼流程也是可以正常进行,没有任何的问题
三、git 相关操作
最后一个任务是 git 提交,我要求 Qwen3 Coder 进行代码的 git 提交并详细记录变更西信息
在这一步中,Qwen 遇到了不小的麻烦,进行了多次的重试
整个提交过程尝试了大约 9 次 才成功完成,根本原因是其在 Windows 命令行下的一些指令没有正确使用,在Windows的命令行中,当使用双引号包围提交信息时,git无法解析这些引号,导致将引号内的每个单词都当作独立的路径参数来处理
但是直到最后,Qwen 也没有找到正确的提交指令,最终使用了一个替代方案来解决问题,它将提交信息写入了一个临时文件,然后使用 git commit -F 从文件中读取提交信息,完成了最后的 commit
小结
我个人最终对 Qwen3 Coder 的评价如下
代码理解能力: ![]()
![]()
![]()
![]()
(5/5) (希望 Qwen 不要太骄傲这只是最基本的一环
需求理解与实现:![]()
![]()
![]()
![]()
(5/5)
响应速度:![]()
![]()
![]()
![]()
(5/5) (这个应该是体验下来非常好的一环,相比于 cc 的时不时断连,gemini 的超绝长考,qwen 的响应速度是让人耳目一新的尤其是我这个急性子
多语言交互:![]()
![]()
(3/5)
系统指令能力:![]()
(2/5) (本次体验中最浪费时间,也是让人体感最差的一环
总体来说 Qwen3 Coder 很适合做一些简单的编码任务,其代码理解能力、响应速度与编码规范都是位于业界的第一梯队,但是需要仔细检查其系统操作,在某些特定场景下需要人工帮助
附录
魔搭 API 设置指引
在项目根目录下创建 .env 文件并输入以下环境变量
OPENAI_API_KEY="你在 ModelScope 的 API KEY"
OPENAI_BASE_URL="https://api-inference.modelscope.cn/v1/"
OPENAI_MODEL="Qwen/Qwen3-Coder-480B-A35B-Instruct"
魔搭提供了每日2000次的推理次数,对于我来说基本是够用了
统计数据
- 总耗时: 37分22秒
- 智能体活跃时间: 10分33秒
- API 调用时间:7分4秒 (67.0%)
- 工具执行时间:3分29秒 (33.0%)
工具调用表现:
- 总调用次数:32 次
- 成功次数:32 次

- 失败次数:0 次

- 成功率:100.0%
Qwen/Qwen3-Coder-480B-A35B-Instruct 使用详情:
- 请求次数:76 次
- 输入Token总量:615,778





