阿里开源Qwen3-Coder编程模型强势登顶,媲美Claude4
时间:2025-07-24 02:51
小编:小世评选
据央广网报道,2023年7月23日,阿里巴巴正式发布了全新的通义千问AI编程大模型Qwen3-Coder。这一模型凭借其卓越的编程能力迅速在全球开源模型领域脱颖而出,不仅超越了GPT4.1等多个闭源模型,还与全球顶尖的编程模型Claude4并驾齐驱,标志着开源编程技术的一个历史性突破。
Qwen3-Coder是千问系列模型中的最新力作,它采用了先进的混合专家(MoE)架构,总参数规模高达480B,通过激活35B参数实现灵活高效的代码生成,其中原生支持256K的token上下文,且可扩展至长达1M的输入长度。这一创新极大增强了处理复杂编程任务的能力,使其在此领域的表现堪称顶尖。在训练过程中,Qwen3-Coder以70%的代码数据预训练,其余部分则专注于强化编程任务及智能体任务的后续训练。这一过程确保了其在通用性、代码生成及智能体交互能力方面的全面提升。
在多项评估指标中,Qwen3-Coder的表现令人瞩目。在浏览器调用及工具调用等智能体能力的测试中,其成绩超越了当前领先的GPT4.1,成为开源模型中的佼佼者。同时,在编程任务自主规划能力的SWE-Bench评测中,Qwen3-Coder凭借其优异的解决能力,获得了开源模型中的最高分,与Claude4不相上下。
特别值得一提的是,Qwen3-Coder在处理复杂任务时展现出的出色智能体能力,尤其是在多步骤长任务的解决上更是游刃有余。它能全面把握任务整体,自主安排工作流程,灵活调用不同的工具深入研究,最终高效地完成复杂编程任务。业内专家认为,Qwen3-Coder的引入有望取代一些价格不菲的闭源模型,快速赢得开发者的青睐,成为Agent领域的首选编程模型。
Qwen3-Coder不仅提升了专业程序员的工作效率,比如在写代码、补全代码、修复Bug等基础任务上显著缩短了时间,还让更多普通用户看到了编程的希望。借助这一模型,编写代码的过程从以往的数小时骤降至几分钟,更多人可以通过简单的自然语言指令,实现复杂的编程功能,比如创建3D物理模拟等,真正实现了“AI氛围编程”(Vibe Coding)的愿景。
为了让全球开发者便捷地使用,Qwen3-Coder已经在魔搭社区、HuggingFace等开源,允许用户免费下载。阿里还将其整合进AI编程产品“通义灵码”,API已上线阿里云“百炼”,极大便利了用户的接入体验。通义团队还开发了命令行工具Qwen Code,使开发者能够充分发掘Qwen3-Coder在代理编程中的潜力,程序与Claude Code、Cline等工具同样支持兼容使用。
截至目前,千问系列编程模型的全球下载量已经突破2000万次,成为当今最受欢迎的开源编程模型。阿里巴巴将内部的多项项目纷纷接入Qwen3-Coder,推动了企业内部效率的提高。不仅国内一些大型企业如一汽集团、中国石油、建设银行、平安集团、南方航空等纷纷引入这一技术,全球范围内的开发者也在积极探索Qwen3-Coder在各自领域的应用潜力。
Qwen3-Coder的问世,不仅是阿里巴巴在人工智能和编程模型领域的一次重大进展,更是整个开源技术生态系统的又一次里程碑。未来,如何进一步优化和拓展Qwen3-Coder的应用场景,将是推动科技进步的重要课题。随着这一模型的普及,相信编程的门槛将会进一步降低,激励更多人参与到这一伟大的技术创新中来,为整个产业的未来注入新的活力。