免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 阿里巴巴发布QwQ-32B开源推理模型,性能媲美DeepSeek-R1

阿里巴巴发布QwQ-32B开源推理模型,性能媲美DeepSeek-R1

时间:2025-03-07 22:50

小编:小世评选

在人工智能领域,随着多项技术的迅速发展,推理模型的应用正在逐渐深化。2023年3月6日,阿里巴巴正式发布了一款名为“通义千问QwQ-32B”的开源推理模型,该模型在多个方面展现了强大的性能,并声称在能力上可以与DeepSeek-R1相提并论。

据悉,QwQ-32B模型经过大规模强化学习的训练,特别是在数学、代码生成及其他通用能力方面实现了显著的突破。这使得其整体性能与行业内的高端模型DeepSeek-R1不相上下,且在资源消耗上得到了有效控制。在普通消费级显卡上,用户也能够进行本地部署,这有效降低了使用门槛。

QwQ-32B的研发团队透露,该模型拥有320亿个参数,而DeepSeek-R1则达到6710亿个参数(其中370亿个处于激活状态)。在冷启动的基础上,QwQ-32B通过针对数学与编程任务的强化学习进行了两轮训练,这种大规模的强化学习策略印证了模型在推理能力上的巨大提升。团队希望这种方法能为通向通用人工智能(AGI)铺就一条可行之路。

QwQ-32B还特别整合了与智能体(Agent)相关的功能,使得模型在使用外部工具时,能够进行批判性思考,并根据环境反馈自动调整其推理过程。这种功能的加入,不仅增强了模型的灵活性,同时也为未来的智能应用提供了更多可能。

在权威的基准测试中,QwQ-32B表现卓越,几乎在所有测试中超越了OpenAI去年发布的o1-mini型号,尤其是在评估数学能力的AIME24数据集上,以及在检验代码能力的LiveCodeBench评估中,QwQ-32B与DeepSeek-R1几乎不相上下。这样的成绩彰显了这款新模型在大型推理系统中的潜力,从而为开发者与研究者提供了新的选择。

为了更好地推广QwQ-32B,阿里巴巴采取了Apache 2.0开源协议,意味着所有用户均可免费下载及商用该模型,或通过通义千问的网页版进行体验。该模型还将在通义APP上免费上架,进一步扩大了其受众范围。

阿里通义的团队在发布会上表示,他们将继续探索智能体与强化学习相结合的方式,以实现更长时的推理,进而不断迈向更高水平的智能。如果成功,阿里巴巴或能够在人工智能领域树立新的标杆,提升行业竞争力。

受QwQ-32B发布消息的影响,阿里巴巴的港股在3月6日开盘时大幅上涨,涨幅一度超过6%,截至午盘时已达7%的涨幅,显示出市场对这一新模型的热切期待与肯定。

值得注意的是,在此之前的2月25日,阿里通义Qwen已发布了基于旗舰模型Qwen2.5-Max构建的推理模型QwQ-Max-Preview预览版。此款新产品同样支持联网搜索,展现出一定的推理能力,将与DeepSeek及Kimi的模型共同展现思考过程,进一步丰富了阿里在AI推理模型领域的产品线。

在QwQ-32B的发布时,我们可以看到,阿里巴巴不仅在技术上取得了长足进步,也在推广开源理念、降低使用门槛上展现了积极的态度,推动了人工智能技术的普及。未来,随着技术的不断改进与应用场景的不断拓展,QwQ-32B及其后续模型有望在推动人工智能的普及、改进应用以及发展更高层次的智能化领域中扮演重要角色。阿里巴巴的这个新进展,为全球人工智能的发展注入了新的活力,值得关注。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多