DeepSeek重塑开源大模型生态,算力需求激增推动AI应用爆发
时间:2025-02-06 04:50
小编:小世评选
随着人工智能技术的飞速发展,开源大模型的生态也在不断演化。近期,国信证券发布了一份专门关注DeepSeek的报告,指出这一新兴企业在开源大模型领域的卓越表现,特别是在算力需求激增的背景下,促使AI应用全面爆发。DeepSeek于2023年7月成立,由幻方量化创办,迅速崭露头角,成为业界不可忽视的力量。
DeepSeek的发展历程可谓迅速且富有成效。2024年5月,公司推出了DeepSeek-V2,标志着全球最强的开源通用Mixture of Experts (MoE) 模型的诞生。仅仅几个月后的同年12月,DeepSeek-V3发布,成功对标一些国际领先的闭源模型,在各项评测中均表现出色。更值得一提的是,该模型的生成速度提升至以前的三倍,性能价格比大幅优化,使得其在市场中具有极大的竞争优势。
2025年1月,DeepSeek-R1发布,进一步将性能提升至与OpenAI的o1正式版相持平,并开源了模型权重,提供API支持,进一步推动了大模型的开放性和可获取性。这一系列的创新,让DeepSeek迅速成为开源大模型领域的领军者,其背后的核心技术如MLA和DeepSeekMoE等,极大提高了推理效率和训练成本的降低,同时采用DualPipe算法和混合精度训练,优化了计算与通信负载,使得AI应用得以快速发展。
在AI应用的推动下,算力需求不断攀升。随着Scaling Law理论的不断成熟及“涌现”能力的增强,全球范围内越来越多的科技公司投入到大模型的研发之中,模型参数规模以指数级速度增长,不断提升模型性能,从传统的大语言模型逐渐演化为多模态模型,极大丰富了AI的应用场景。这一趋势推动了全球IT支出增长,同时也加速了生成式AI市场的扩张。
全球数据总量的激增,让数据中心的算力需求日益增长。英伟达的CUDA及其GPU架构实现了快速迭代,其GPU算力倍增为下一代AI模型的落地提供了强劲支持。国内外云服务商的资本开支持续扩大,直接推动了AI服务器市场的迅猛发展。尽管GPU依然是市场的主流,但搭载ASIC芯片的服务器占比逐渐攀升,体现出市场对定制化算力的需求不断上升。伴随着这种趋势,国产ASIC服务商逐渐受到关注,为整个算力生态带来了更多可能性。
除了AI行业本身,算力需求的激增也对PCB行业产生了重要影响,成为主要增长引擎。服务器的升级不仅推动了PCB板层数的增加,还降低了CCL介电损耗,这一变化有助于HDI市场的成长和新应用领域的开发。这些行业间的融合与创新,均在为AI应用的进一步普及奠定基础。
总体而言,DeepSeek在开源大模型生态中的崛起,充分体现了技术快速发展的时代特征。通过不断创新和优化,DeepSeek不仅提升了自身的竞争力,还为整个AI行业注入了新的活力。在未来,随着更多企业的加入和更多技术的突破,开源大模型的生态将愈加完善,AI应用也将更加广泛和深入。在技术进步与市场需求的推动下,DeepSeek和类似企业将继续为AI行业带来更高的算力、更优的技术,以及更丰富的应用场景,描绘出更加光明的未来。