深度求索发布DeepSeek-R1模型并开源660B权重与新许可证

时间：2025-01-23 19:10

小编：星品数码网

近日，幻方量化旗下的人工智能公司深度求索（DeepSeek）宣布正式推出其最新的DeepSeek-R1模型，并将660B的模型权重开源。这一举措不仅将助力AI领域的技术发展，还进一步推动了模型共享和创新。

据官方介绍，DeepSeek-R1模型是在后训练阶段广泛应用强化学习技术的结果。通过这种技术，DeepSeek-R1在仅依赖少量标注数据的情况下，显著增强了模型的推理能力。这意味着，用户在进行各种推理任务时，将能够获得更高的准确性和效率。DeepSeek的研发团队表示，该模型的表现已达到业界领先水平，为用户提供了一个强大的工具以满足其需求。

在本次发布中，DeepSeek不仅开源了DeepSeek-R1模型，还推出了“DeepSeek-R1-Zero”及其它660B模型，并通过DeepSeek-R1的输出，蒸馏了6个小型模型以满足不同用户的需求。值得注意的是，两个小模型——32B和70B，已经在多项能力上达到了与全球知名AI公司OpenAI的o1-mini模型相当的水平。这标志着DeepSeek在模型压缩和效率优化上的成功，为开发者与AI研究者提供了更多的选择空间。

用户能够通过DeepSeek的官方网站或官方应用程序，使用“深度思考”模式，体验到最新的DeepSeek-R1模型。这种使用方式为广大开发者、研究人员以及AI爱好者提供了一个便捷的入口，以便于他们完成各类推理任务。而在API服务方面，DeepSeek的定价策略也相对亲民，提供了每百万输入tokens 1元（缓存命中）/ 4元（缓存未命中），每百万输出tokens 16元的收费模式，使得企业和个人都能以较低的成本体验到高水平的人工智能服务。

更为重要的是，DeepSeek还对其开放政策进行了大胆的调整，决定将所有训练技术公开，并将开源仓库，包括模型权重，统一采用标准化、宽松的MIT License。这一决定背后反映了DeepSeek对推动技术开放的重要性认识。近年来，随着AI技术的不断进步，开源成为了该领域的一大趋势，而复杂且非标准的开源许可证常常给开发者带来理解上的障碍。DeepSeek希望通过采用MIT License，使得开发者能够更容易理解和使用开源资源，降低技术应用的门槛。

除了标准化许可证外，DeepSeek还鼓励用户进行“模型蒸馏”。这意味着用户可以利用DeepSeek-R1模型的输出结果，训练得到其他模型，从而激励更多的创新与合作。在AI技术日益蓬勃发展的今天，模型蒸馏成为了提升模型性能和小型化的重要手段。通过对原模型进行蒸馏，用户不仅可以在性能上获得更好的体验，还能够推动更小型、灵活和高效模型的开发，进而满足不同场景下的应用需求。

深度求索在AI和量化技术的交叉领域，凭借着强大的技术背景和市场洞察力，持续引领着行业的发展趋势。在未来，DeepSeek将不断推进技术的创新与应用，力求为行业的开源生态建设贡献更多力量。随着DeepSeek-R1的发布与开放，深度求索的愿景是通过技术突破，不断推动AI应用的普及与发展，让更多的用户受益于人工智能技术的力量。

DeepSeek-R1模型的发布，660B权重开源以及新许可证的推出，标志着深度求索在AI领域迈出了重要一步。这不仅提升了行业的技术水平，也为广大的开发者和用户提供了更多的机遇与选择。未来，随着技术的不断演进和开放合作的深入，我们有理由相信，DeepSeek将继续在全球AI领域发挥其重要作用，推动更广泛的技术应用与创新。

深度求索发布DeepSeek-R1模型并开源660B权重与新许可证

精品推荐

相关文章

深度求索发布DeepSeek-R1模型 并开源660B权重与新许可证

精品推荐

相关文章

深度求索发布DeepSeek-R1模型并开源660B权重与新许可证