免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 阿里云万相2.1模型开源:全球开发者可下载体验,助力AI生态发展

阿里云万相2.1模型开源:全球开发者可下载体验,助力AI生态发展

时间:2025-02-26 14:40

小编:小世评选

2023年2月25日晚,阿里云宣布其视觉生成基座模型万相2.1(Wan)正式开源。这一举措采用了开放性极高的Apache 2.0协议,允许全球开发者自由下载体验。万相2.1提供了14亿和1.3亿两个参数规格的推理代码和权重,支持包括文生视频和图生视频在内的多种生成任务,开发者能够在GitHub、HuggingFace和魔搭社区等获取相关资源。

万相2.1的14B版本在多个方面表现出色,尤其是在指令遵循、复杂运动生成、物理建模以及文字视频生成等领域。根据权威评测集VBench的结果,万相2.1以86.22%的综合得分显著超越了Sora、Luma、Pika等众多国内外同行,稳居排行榜首位。1.3B版本同样媲美更大参数规格的开源模型,并且在仅需8.2GB显存的消费级显卡上即可运行,生成高质量视频,尤其适合二次模型开发及学术研究。

在算法设计上,万相采用了前沿的DiT架构和创新的线性噪声轨迹Flow Matching范式,开发了高效的因果3D VAE和可扩展的预训练策略。例如在3D VAE的实现过程中,万相采用了一种特征缓存机制来提高长视频的编码和解码效率,这样不仅可以处理无限长的1080P视频,还显著降低了内存占用,推理时内存占用减少了29%,在保证性能的同时,提升了运行效率。

万相团队在测试中显示,该模型在运动质量、视觉质量、风格多样性以及多目标跟踪等众多维度上均达到了当前业界的领先性,尤其在复杂运动与物理规律遵循上,万相能够精准展现各种复杂的人物肢体运动,如旋转、跳跃、转身和翻滚,同时能够真实再现碰撞、反弹和截断等复杂真实物理场景。

自2023年起,阿里云坚定推动大模型的开源与共享。自去年8月开始,阿里云接连推出了Qwen、Qwen1.5、Qwen2、Qwen2.5四代模型,涵盖了0.5B至110B不同参数规格,具备多模态功能,已在国内外多个权威榜单上崭露头角,形成了全球最大的开源AI模型系列,千问(Qwen)衍生模型的数量更是突破了10万个。

随着万相的正式开源,阿里云成功实现了全模态、全规格大模型的全面开放。值得一提的是,随着开源潮流的兴起,阿里云成为了国内外众多大模型项目中不可或缺的重要参与者。在过去几个月中,包括字节跳动、昆仑万维、百度文心等企业纷纷推出自己的开源模型,显示出大模型开源正在成为行业的“标配”。

阿里巴巴集团CEO吴泳铭于2月24日的演讲中宣布,未来三年内,阿里计划投入超过3800亿元人民币,用于云和AI硬件基础设施的建设,这一投资总额将超出过去十年的总和,创造了中国民营企业在相关领域建设的最大投资记录。吴泳铭强调,AI产业的爆发远超预期,当前国内科技产业正在蓬勃发展,潜力巨大。他表示,阿里巴巴将全力以赴推动云和人工智能基础设施的建设,以促进整个行业的生态发展。

在其近期的财报会上,吴泳铭透露,阿里将很快发布基于千问Qwen2.5-MAX的深度推理模型。万相团队也在海外社交上发布了QwQ-Max-Preview(推理模型预览版),并即将推出可部署在本地的更小版本及QwQ-Max官方App。

目前,阿里云已经成为亚洲领先的云计算服务提供商,而阿里巴巴的通义千问大模型则在全球范围内跻身顶尖开源模型之列。3800亿元的巨额投资不仅能有效提升相关产业的信心,还表明阿里巴巴坚信技术的未来和未来的投资价值。随着技术的不断进步和模型的开放共享,AI生态将迎来更为蓬勃的发展前景。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多