免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 阿里巴巴Qwen团队开源Qwen3-Coder编程模型 助力软件开发效率提升

阿里巴巴Qwen团队开源Qwen3-Coder编程模型 助力软件开发效率提升

时间:2025-07-24 01:40

小编:小世评选

近日,阿里巴巴Qwen团队在编程模型领域取得了突破性进展,正式发布了其最新的旗舰编程模型——Qwen3-Coder-480B-A35B-Instruct。这款模型的开源不仅标志着Qwen团队在智能体编程领域的重要里程碑,还引起了行业内的广泛关注。

超强的模型简介

Qwen3-Coder具备4800亿个参数,其中350亿个处于激活状态,展现出超级计算的潜力。这一模型支持原生256K的上下文长度,并可通过技术扩展将上下文长度提高到100万。在输出方面,Qwen3-Coder的最大生成能力达到了65000个token。这样的参数和能力使得Qwen3-Coder在各类智能体编程任务中表现出色,如智能体编程、浏览器使用和工具调用。根据基准测试数据,Qwen3-Coder在上述任务领域均取得了领先于其他开源模型(如Kimi K2、DeepSeek V3)及闭源模型(如GPT-4.1)的优异成绩,其编程能力甚至与Claude Sonnet 4相当。

助力初级程序员

更令人振奋的是,Qwen3-Coder能够显著提升软件开发效率。据官方介绍,借助这一模型,初级程序员在一天内便能完成资深程序员一周的工作量。例如,生成一个品牌官网的过程最快仅需5分钟。这一进展将为整个软件开发行业带来颠覆性的变化,帮助企业以更高效的方式投入资源,推动创新。

智能体编程命令行工具的开源

除了Qwen3-Coder模型外,Qwen团队还推出了Qwen Code这一智能体编程命令行工具。该工具基于Gemini Code进行分叉和定制开发,旨在通过适配特定的提示和函数调用协议,充分发挥Qwen3-Coder的潜力。Qwen Code的推出,不仅降低了智能体编程的门槛,也使得更多开发者能够更轻松地参与到智能编程的浪潮中。

便捷的API接入

Qwen3-Coder模型已经在阿里云的大模型服务“百炼”上线,开发者可以通过API进行接入,采用阶梯计费方式,根据输入的token量进行定价。尽管在特定的输入范围内,其价格略高于Claude Sonnet 4模型,但考虑到Qwen3-Coder在功能和性能上的显著优势,这一价格定位仍具有一定的市场竞争力。Qwen3-Coder的480B版本也在Hugging Face、魔搭等开源社区发布,供开发者下载与本地部署。

实际应用的探索与反馈

在Qwen3-Coder正式发布前,这一模型已经悄然上线于Qwen Chat官网,并获得了一批海外用户的实测反馈。用户借助Qwen3-Coder开发出多款有趣的应用,包括Wordle单词游戏和找不同游戏,这些成功的案例凸显了Qwen3-Coder在指令遵循、用户界面设计和动画处理等方面的强大能力。同时,国内媒体还尝试利用Qwen3-Coder开发了一套中英文术语库,并对生成结果进行了优化和修改,进一步展示了其应用潜力。

深入的技术细节与创新

从技术的角度来看,Qwen团队在其博客中分享了Qwen3-Coder的一些训练机制和细节。他们提到,在预训练阶段,Qwen3-Coder使用了75万亿个数据token,其中70%为代码。这一设计使得Qwen3-Coder在编程工作方面有着卓越的表现,并保留了深厚的通用性和数学能力。Qwen团队也通过自动扩展多样化的编程任务测试用例,以创建高质量的训练实例,这一措施不仅提高了代码执行的成功率,还促进了其他任务的显著进展。

在后训练阶段,Qwen团队引入了长视距强化学习方法,以激励模型通过工具进行多轮交互来解决现实世界中的复杂任务。为了应对环境扩展的挑战,他们构建了一个能够并行运行20000个独立环境的可扩展系统。这一基础设施为大规模强化学习提供了必要的支持和反馈,使Qwen3-Coder在SWE-Bench Verified基准测试中取得了开源模型的最佳表现。

展望未来

随着Qwen3-Coder的开源与广泛应用,阿里巴巴Qwen团队致力于进一步提升Coding Agent的性能,旨在将其打造为能够承担软件工程中复杂且单调任务的智能助手,从而释放人类在创造性和开发性工作中的生产力。未来,我们期待看到越来越多基于Qwen3-Coder的新型应用和开发成果,从而引领智能编程的新时代。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多