中科曙光上线DeepSeek V3和R1模型，提升AI计算性能

时间：2025-02-07 05:00

小编：星品数码网

2024年2月4日，中科曙光国家先进计算产业创新中心有限公司宣布，海光信息技术团队成功研发并发布了DeepSeek V3和R1模型，并已正式上线。这一令人瞩目的进展标志着在人工智能领域的又一重要里程碑，项目主要依托于海光自主研发的深度计算单元（DCU），旨在提升AI计算性能，为各行各业提供更加高效的解决方案。

用户可以访问中科曙光的“光合开发者社区”，在特定板块下载相关模型，或登陆光源官网，搜索“DeepSeek”进行模型的部署与使用。此举大幅降低了用户的使用门槛，使得AI局部技术的应用更加广泛和便捷。

DeepSeek V3与R1模型基于先进的Multi-Head Latent Attention（MLA）和DeepSeek MoE（Mixture of Experts）两大核心技术进行构建。MLA技术通过减少键值（KV）缓存，从而显著降低了内存占用，进而提升了推理的效率。这一技术的创新应用，使得DeepSeek V3与R1在处理复杂的数据时，能够更迅速、高效地完成运算，极大改善了用户的计算体验。

DeepSeek MoE技术则通过引入辅助损失（auxiliary loss）机制，达成了专家负载的智能平衡。这一智能化的设计，进一步优化了模型性能，使得在多任务处理时，模型能够更好地分配计算资源，从而提升整体效率。特别是在需要处理大量数据和高复杂度任务的场景下，这种平衡策略能够有效防止资源浪费，从而实现更高的计算效率和更好的性能输出。

值得一提的是，海光信息推出的深度计算单元（DCU）是一款高性能的AI加速计算，旨在为行业客户提供自主可控的全精度通用AI计算解决方案。DCU不仅为中科曙光的DeepSeek V3与R1模型提供了强大的硬件支持，同时它的设计也考虑了行业内多样化的需求，确保各类企业均能根据自身需求进行灵活配置与高效运用。

目前，DCU已经在多个领域实现了规模化应用，包括科教、金融、医疗、政务和智能计算中心等行业。尤其是在医疗领域，AI技术的快速发展为疾病诊断和治疗服务提供了无限可能。通过DeepSeek V3与R1模型的落地，中科曙光希望能够进一步推动医疗AI的发展，使得在临床数据处理和预测模型方面，能够更好地服务于患者和医务人员，提升医疗服务品质。

在金融及政务领域，AI技术也日益成为支撑决策和经营的重要工具。采用DeepSeek V3与R1模型后，可以更准确地分析市场趋势和客户需求，帮助企业和机构更快速地做出应对决策，提高服务质量和效率。

中科曙光推出的DeepSeek V3与R1模型，通过引入创新性技术，显著提升了AI计算性能。不仅丰富了AI在实际应用中的生态，也为各行业注入了新的技术驱动力。未来，随着AI技术的不断演进和发展，中科曙光将继续致力于推动国内AI产业的创新升级，为更多行业提供更加智能化的解决方案。

对于中科曙光的用户借助DeepSeek V3与R1模型，用户可以更加便捷地进行AI应用开发，不论是在技术能力上，还是在资源配置上，均能获得更加优异的体验。中科曙光的发展实践证明，创新是推动行业进步的动力，而应用场景的挖掘和技术的进步是实现这一目标的关键因素。未来，中科曙光期待更多合作，共同探索AI技术在各领域的应用潜力，通过技术创新为社会发展贡献更多力量。

中科曙光上线DeepSeek V3和R1模型，提升AI计算性能

精品推荐

相关文章