深度求索发布DeepSeek-R1模型 并开源660B权重与新许可证
时间:2025-01-23 19:10
小编:小世评选
近日,幻方量化旗下的人工智能公司深度求索(DeepSeek)宣布正式推出其最新的DeepSeek-R1模型,并将660B的模型权重开源。这一举措不仅将助力AI领域的技术发展,还进一步推动了模型共享和创新。
据官方介绍,DeepSeek-R1模型是在后训练阶段广泛应用强化学习技术的结果。通过这种技术,DeepSeek-R1在仅依赖少量标注数据的情况下,显著增强了模型的推理能力。这意味着,用户在进行各种推理任务时,将能够获得更高的准确性和效率。DeepSeek的研发团队表示,该模型的表现已达到业界领先水平,为用户提供了一个强大的工具以满足其需求。
在本次发布中,DeepSeek不仅开源了DeepSeek-R1模型,还推出了“DeepSeek-R1-Zero”及其它660B模型,并通过DeepSeek-R1的输出,蒸馏了6个小型模型以满足不同用户的需求。值得注意的是,两个小模型——32B和70B,已经在多项能力上达到了与全球知名AI公司OpenAI的o1-mini模型相当的水平。这标志着DeepSeek在模型压缩和效率优化上的成功,为开发者与AI研究者提供了更多的选择空间。
用户能够通过DeepSeek的官方网站或官方应用程序,使用“深度思考”模式,体验到最新的DeepSeek-R1模型。这种使用方式为广大开发者、研究人员以及AI爱好者提供了一个便捷的入口,以便于他们完成各类推理任务。而在API服务方面,DeepSeek的定价策略也相对亲民,提供了每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元的收费模式,使得企业和个人都能以较低的成本体验到高水平的人工智能服务。
更为重要的是,DeepSeek还对其开放政策进行了大胆的调整,决定将所有训练技术公开,并将开源仓库,包括模型权重,统一采用标准化、宽松的MIT License。这一决定背后反映了DeepSeek对推动技术开放的重要性认识。近年来,随着AI技术的不断进步,开源成为了该领域的一大趋势,而复杂且非标准的开源许可证常常给开发者带来理解上的障碍。DeepSeek希望通过采用MIT License,使得开发者能够更容易理解和使用开源资源,降低技术应用的门槛。
除了标准化许可证外,DeepSeek还鼓励用户进行“模型蒸馏”。这意味着用户可以利用DeepSeek-R1模型的输出结果,训练得到其他模型,从而激励更多的创新与合作。在AI技术日益蓬勃发展的今天,模型蒸馏成为了提升模型性能和小型化的重要手段。通过对原模型进行蒸馏,用户不仅可以在性能上获得更好的体验,还能够推动更小型、灵活和高效模型的开发,进而满足不同场景下的应用需求。
深度求索在AI和量化技术的交叉领域,凭借着强大的技术背景和市场洞察力,持续引领着行业的发展趋势。在未来,DeepSeek将不断推进技术的创新与应用,力求为行业的开源生态建设贡献更多力量。随着DeepSeek-R1的发布与开放,深度求索的愿景是通过技术突破,不断推动AI应用的普及与发展,让更多的用户受益于人工智能技术的力量。
DeepSeek-R1模型的发布,660B权重开源以及新许可证的推出,标志着深度求索在AI领域迈出了重要一步。这不仅提升了行业的技术水平,也为广大的开发者和用户提供了更多的机遇与选择。未来,随着技术的不断演进和开放合作的深入,我们有理由相信,DeepSeek将继续在全球AI领域发挥其重要作用,推动更广泛的技术应用与创新。