NVIDIA发布未来架构规划:Blackwell与Rubin亮相,力争性能新高
时间:2025-03-19 10:00
小编:小世评选
在半导体市场持续激烈竞争的背景下,NVIDIA于日前宣布了其下一代架构规划,正式推出了Blackwell和Rubin两个新架构。尽管Blackwell在推出初期面临了一些挑战,但NVIDIA依然保持对未来技术发展的信心,意图在高性能计算(HPC)和人工智能(AI)领域进一步提升市场竞争力。
Blackwell架构:全新性能突破
NVIDIA的Blackwell架构计划在2024年下半年正式发布,主要面向加速卡和游戏卡市场。Blackwell架构的核心特点是其Dense FP4的高性能,其计算能力高达15 PFlops(每秒1.5亿亿次计算),相比于上代产品的提升幅度达到50%。在数据传输方面,Blackwell还采用了CX8互连技术,其带宽高达14.4 TB/s,较之前版本也增加了100%。
整机的Dense FP4推理性能提升至1.1 EFlops(每秒110亿亿次),而FP8训练性能则达到了0.36 EFlops(每秒36亿亿次)。值得注意的是,Blackwell架构还引入了新的注意力指令,旨在进一步优化AI模型的推理效率,特别是在自然语言处理和计算机视觉等领域。
Rubin架构:定位未来的极致性能
展望2026年,NVIDIA将推出全新的Rubin架构,这是NVIDIA在高性能计算和人工智能领域的又一重要布局。Rubin架构将带来更为强大的计算能力,首发服务器产品的FP4浮点性能将高达50 PFlops(每秒5亿亿次)。在连接性方面,Rubin采用了1.8 TB/s带宽的NVLink-C2C总线,而NVLink6的带宽则提升至260 TB/s,CX9总线带宽也大幅提升至28.8 TB/s,这将大幅提升GPU间的协作效率。
在推理和训练性能方面,Rubin架构同样表现出色:FP4推理性能将达到3.6 EFlops(每秒360亿亿次),而FP8训练性能则为1.2 EFlops(每秒120亿亿次)。这一系列技术革新标志着NVIDIA在支持更复杂计算任务方面迈出了积极步伐。
未来展望:进一步突破性能极限
NVIDIA并未止步于Rubin架构的推出,2027年,公司将发布升级版的Rubin架构,其FP4浮点性能进一步提升至惊人的100 PFlops(每秒10亿亿次)。在数据传输方面,NVLink互连总线将再次升级,其带宽将达到惊人的1.5 PB/s,而CX9总线的带宽也将跃升到115.2 TB/s,这将为未来计算需求提供更为广阔的带宽保障。
NVIDIA在性能与能效比方面的努力也是值得关注的重点。在AI应用与高性能计算的趋势下,如何保持强大的计算能力的同时,降低能耗是当前行业面临的重要挑战。NVIDIA的这些新架构将通过优化设计和提升能效来应对这一挑战。
NVIDIA的Blackwell与Rubin架构不仅展示了其在GPU技术领域的不断进步与创新,也为未来的高性能计算和人工智能应用提供了强有力的支撑。伴随着这些新架构的推出,NVIDIA将不仅巩固其在市场上的领导地位,也将推动整个行业向更加高效、智能的方向发展。
在未来的科技生态中,NVIDIA将扮演着越来越重要的角色,不仅为开发者提供强大的硬件支持,也为整个数字经济带来变革性的影响。在此技术发展过程中,如何继续把握市场趋势、创新产品,并保持与时俱进,将是NVIDIA未来持续成功的关键。