通义灵码SWE-GPT获ISSTA 05杰出论文奖，推动AI辅助软件开发新范式

时间：2025-07-04 07:25

小编：小世评选

在全球软件工程领域的重要盛会——国际软件测试与分析研讨会ISSTA 05上，通义灵码的创新性研究成果《SWE-GPT: A Process-Centric Language Model for Automated Software Improvement》荣获杰出论文奖。这一认可不仅展示了SWE-GPT强大的技术潜力，更为AI辅助软件开发的未来发展指明了方向。

ISSTA是软件工程领域的一项顶尖学术会议，聚焦于软件测试、程序分析、代码质量保障等前沿技术。此次，会议共收到550篇投稿，最终仅有7篇被录用，其中被评为杰出论文的仅有9篇，SWE-GPT的获奖不仅体现了其理论基础的坚实，更揭示了其在实际应用中的重要性和潜力。

SWE-GPT是一种以软件开发流程为中心的大型语言模型。其研究论文详细介绍了其训练框架与训练过程，SWE-GPT的主要创新点在于模拟了真实的软件开发过程。这意味着，SWE-GPT能够真实再现软件开发中的动态交互、问题识别与解决的复杂性。ISSTA评审委员会专家指出，SWE-GPT在AI辅助软件开发领域的重要性不可小觑，其提出的模型和方法为该领域的发展奠定了坚实基础。

SWE-GPT基于通义千问Qwen.5为基础模型，并在后续的训练阶段对人类程序员的思维方式进行了深入模拟。通过学习复杂问题的端到端多步骤解决过程，SWE-GPT实现了对软件工程领域真实问题的上手能力。在训练过程中，通义灵码团队创新性地引入了合成数据，通过模拟真实开发中的动态问题解决过程，比如代码库理解、故障定位和修复补丁生成等，突破了现有大模型在软件开发中的局限性。

为了增强模型在不同阶段的表现与鲁棒性，通义灵码团队在训练过程中采用了课程学习的方法。该方法设计了一个循序渐进的学习过程，随着模型能力的提升，逐步加入更复杂的任务，从而提升模型对高难度问题的解决能力，确保模型的基础能力得以巩固。这种有序的训练策略使得SWE-GPT在面对现实发展中的各种挑战时，能够更加从容应对。

实验结果显示，SWE-GPT 7B在权威基准SWE-bench-Verified（涵盖500项真实GitHub任务）的测试中，以0.0%的问题解决率创下开源纪录，相较于Llama 0.5B提升了0.76%，并接近同期闭源模型GPT-0。更为惊喜的是，轻量级的SWE-GPT 7B模型以8.0%的解决率超越了Llama 70B的7.0%，显示出小型模型在复杂软件维护任务中的强大实用价值。

值得一提的是，SWE-GPT不仅仅是一个单一功能的模型，它是一个通用框架，具备持续拓展的能力。这一框架可以融合思考能力和测试时扩展（test-time scaling），使得小尺寸模型在SWE-bench-Verified基准上可以达到6%的问题解决率，接近业界领先的闭源模型Claude 5 Sonnet与OpenAI。通义灵码算法负责人李永彬对此表达了积极的看法：“基于大模型的软件工程智能化领域的研究与应用正在快速进步，单纯依赖现有基础模型难以满足真实场景需求，而SWE-GPT则为AI辅助软件开发开辟了新的范式。”

SWE-GPT的成功推广标志着AI辅助软件开发的新时代即将来临。随着软件开发的愈加复杂化，以及对开发效率的进一步提升需求，SWE-GPT的应用前景将愈加广泛。未来，通义灵码团队预计将根据不断变化的市场需求与技术进步，继续优化和拓展SWE-GPT的能力，以满足更复杂和多样化的开发需求。

通义灵码SWE-GPT的出现不仅推动了学术界与工业界的深度融合，也为实现AI在软件开发中的全面应用奠定了基础，使得AI辅助软件开发的新模式正在逐步形成。这一切都为我们揭示了一个更为智能、高效的未来软件开发世界的可能性。

通义灵码SWE-GPT获ISSTA 05杰出论文奖，推动AI辅助软件开发新范式

精品推荐

相关文章