国产AI大模型DeepSeek引发华尔街震动,英伟达股价暴跌超12%
时间:2025-01-29 11:50
小编:小世评选
近日,国产AI大模型DeepSeek的成功引发了在金融市场上的强烈反响,尤其是在华尔街,影响尤为显著。根据最新的市场动态,英伟达、ASML、台积电等多家芯片公司的股价出现了急剧下跌,其中英伟达的跌幅超过12%,市值蒸发超4000亿美元。分析人士将这一现象归咎于DeepSeek的崛起以及其推出的新推理模型,这降低了投资者对英伟达未来AI芯片需求的预期。
DeepSeek,作为中国的一个前沿AI公司,最近推出了DeepSeek-V3与DeepSeek-R1两个大规模预训练模型,凭借其低成本和高性能吸引了广泛关注。这两个模型以开源方式推广,迅速在AI产业内造成了颠覆性的影响,令许多此前依赖大规模算力和高成本训练模型的公司重新审视其市场定位与发展策略。DeepSeek不仅在中国市场大获成功,还在美国市场上取得了显著的成绩,其应用在苹果App Store中国和美国地区的免费应用下载排行榜上均位列第一,超越了ChatGPT,这一现象在历史上尚属首次。
德国《世界报》知名市场评论员Holger Zschaepitz指出,中国的DeepSeek可能是对美国股市的最大威胁,因为其以极低的成本构建了突破性的人工智能模型,质疑了在该行业投资数千亿美元的必要性。这一观点引起了广泛共鸣,很多业内人士对此表示赞同。
在过去,AI大模型的开发通常依赖于Scaling Law理论,鼓励厂商通过扩展算力以提升模型性能。DeepSeek的成功证明了这一理论并非绝对。该公司通过优化模型架构与基础设施,仅花费557.6万美元就完成了DeepSeek-V3的训练。这一训练成本远低于其他市场主流模型。例如,Llama-3-405B的训练成本接近5460万美元,而GPT-4o与Claude-3的开销更是高达1亿美元,分别是DeepSeek-V3的10倍以上。
更引人注目的是DeepSeek的深度推理模型DeepSeek-R1,它在多个重要任务上表现出色,并与OpenAI的o1版本相当。DeepSeek-R1的训练路径创新地采用了强化学习,避免了以往需要大量数据进行监督微调的传统方式。这一创新不仅提高了模型的效率,也使得DeepSeek的成本优势愈发明显。
DeepSeek未公布其新模型的确切训练成本,但其API服务定价极具竞争力——每百万输入tokens仅售1元,这一价格显然使得其在市场上占据优势。虽然DeepSeek的技术正版保持了高水准,但相比于传统的高算力依赖模型,的DeepSeek则揭示了突破性的可能性。
随着DeepSeek的崛起,市场开始对支撑英伟达的算力信仰产生怀疑。AI市场的动态变化导致英伟达的股市表现承压,最新季度该公司的营收增速也有所减缓。财报显示,英伟达2025财年第三财季的营收增速下降至94%,而2025财年第四财季的营收预计仅为375亿美元,同比增长不到70%。种种迹象表明,行业内的竞争格局正在发生变化。
DeepSeek的成功让各大AI公司不得不重新思考其发展战略。微软CEO萨蒂亚·纳德拉提到,DeepSeek在推理计算方面表现出色,这让市场不得不认真审视中国AI的进步。Meta CEO扎克·扎克伯格也在节目中坦言,DeepSeek的技术让他感到压力,认为这可能会影响美国在科技领域的领先地位。因此,Meta迅速反应,组建多个项目组,以研究DeepSeek的工作原理和降低其训练与运行成本的可能性。
全球最大的开源HuggingFace也表态计划复刻DeepSeek-R1,并将其所有训练数据与脚本开源,这将进一步推动AI行业的创新与发展。过去的AI复现通常很困难,因为许多开发公司采取闭源策略,而DeepSeek的开源路线则为行业提供了新机会。
不过,DeepSeek的成功是否能够被广泛复制,依然存在不确定性。虽然其他公司可能会尝试模仿其技术,但由于市场竞争与自身战略的不同,这一过程并不会一帆风顺。在长远看来,AI领域的创新和技术突破仍需不断投入和探索,而不是在短期内寻找成本最低的解决方案。
DeepSeek的成功不仅意味着AI技术发展的新机遇,也让整个行业陷入深思。未来的AI应用趋势会向推理阶段倾斜,市场对算力的需求可能会发生根本变化,对依赖算力竞争的企业构成挑战。随着技术的不断演进,英伟达需要适时调整其业务战略,以适应新的市场环境和竞争格局。