英伟达新AI芯片Blackwell遭遇技术问题 多家客户削减订单
时间:2025-01-14 03:10
小编:小世评选
近几日,英伟达的新一代人工智能芯片Blackwell在美东时间1月13日的消息引发了业内关注。据《The Information》报道,Blackwell在部署至客户的数据中心时,遭遇了严重的技术问题,这些问题不仅阻碍了数据中心的部署进程,也导致多家重量级客户减少了对该芯片的订单。
技术问题引发的市场反应
英伟达Blackwell芯片的主要问题集中于服务器机架的过热和芯片连接异常。这种故障极大影响了客户的部署计划,尤其是像微软、亚马逊AWS、谷歌、Meta等大型科技公司,近期纷纷宣布削减部分Blackwell GB200机架的订单。这一消息对英伟达的股价带来了直接的影响,早盘一度下跌超过4.7%。
Blackwell芯片的初衷与期望
Blackwell芯片被寄予了厚望,相较于之前的Hopper产品,其能源效率得到了显著提升,吸引了众多云服务提供商和数据中心运营商。每家公司为此下达的订单金额均在100亿美元以上。将多个高功耗的Blackwell芯片集成到一个机架的过程,比原先预想的要复杂得多。机架的尺寸甚至比家用冰箱还要大,重量接近一辆本田思域车,且需采用水冷而非传统风冷系统。这种新的部署方式,对许多AI开发商和数据中心运营商而言,都是一项前所未有的挑战。
订单削减与替代选择
面对过热和连接的问题,客户们不得不寻找其他解决方案。有的选择推迟订单,等待预计将在下半年推出的新改进版本,而另一些则决定转向英伟达的旧款AI芯片,作为临时替代方案。虽然英伟达推荐的整机架解决方案受到推崇,但部分客户开始倾向于单独购买Blackwell芯片,以便自行组装,从而规避当前机架的问题。
尽管现状严峻,英伟达仍有机会扭转局势。如果能够快速解决这些技术问题,客户很可能会重新恢复对Blackwell的订单。Blackwell芯片本身的性能仍然高于前一代产品,因此英伟达有可能在未来为这些问题机架找到新的买家。
客户的延误与需求变化
英伟达原本预计,Blackwell将在今年第一季度为公司带来数十亿美元的收入,且助力其数据中心芯片收入从475亿美元提升至1500亿美元的目标。芯片的交付延误显著影响了客户的部署计划。例如,作为OpenAI的服务提供商,微软原计划在其一个数据中心中安装至少5万枚Blackwell芯片的GB200机架,然而随着Blackwell芯片的交付延迟,OpenAI要求微软尽快提供上一代的H200芯片作临时替代,这导致原定的GB200机架需求急剧下降。
目前,微软计划在年内安装12000枚Blackwell芯片的GB200机架,这一数字仅为最初计划的四分之一。微软还在考虑在年底推出的GB300机架时进行补货。这一系列变动突显了芯片市场的不可预测性,以及公司在面对技术难题时的调整能力。
面临的持久问题与行业前景
英伟达于去年11月曾预测,因设计缺陷所导致的交付延误影响了产品的市场推进。尽管英伟达已对初期的设计划进行了修复,但客户仍对长时间的过热问题表示担忧,为此英伟达不得不多次要求供应商更改设计。诸如芯片间的数据传输不一致等问题依然突出,这可能导致Blackwell机架的设置时间超出预期,并可能使其性能低于公司所承诺的水平。
尽管面临诸多挑战,英伟达凭借其行业内的领先地位与技术实力,依旧站在市场的前沿。若能成功解决存在的技术问题,随着下半年可能面市的改进版本,未来的市场机会依然广阔。AI技术的发展既为英伟达带来了挑战,也赋予了它重新崛起的可能,关键在于如何有效应对技术难题以及客户需求变化。
英伟达Blackwell芯片的遭遇并非孤立事件,其背后折射出的不仅是公司一己的技术问题,更是整个数据中心行业在追求高效能与高密度部署过程中的挑战与机遇。