DeepSeek一夜成名：美国科技巨头Meta为之恐慌，AI模型引发投资者关注

时间：2025-01-27 04:40

小编：小世评选

在瞬息万变的科技界，DeepSeek这个名字在最近引发了广泛的讨论与关注。作为幻方量化旗下的AI公司，自1月24日其最新模型DeepSeek-V3发布以来，这家公司以其出乎意料的表现，迅速崭露头角，成为媒体和投资者瞩目的焦点。

一切的起点是一个匿名社交teamblind上的帖子，这个帖子由一名Meta的员工发布，内容直指DeepSeek的影响力。他表示，Meta内部陷入了对于DeepSeek模型的恐慌之中。DeepSeek-V3的表现可谓令人瞩目，不仅在基准测试中超越了Meta的Llama 4，而且构建成本也引发了广泛的关注。这位员工不无讽刺地提到，DeepSeek只花费了550万美元的训练预算，就取得了如此巨大的成功，相比之下Meta的投入则显得相形见绌。

进一步分析DeepSeek的模型建设，市场评论员Holger Zschaepitz指出，DeepSeek的崛起可能成为对美国股市的一大威胁。因为DeepSeek在无须使用顶尖显卡的条件下，以极低的成本开发出突破性的AI模型，这让各大投资公司重新审视自己在AI行业的巨额投资是否真正有效。在传统观念中，AI开发需要高昂的资金和先进的硬件支持，但DeepSeek的成功却在打破这一成规。

DeepSeek通过2048块H800显卡经过两个月的训练，成功打造出参数量达到6710亿的DeepSeek-V3。这一效率相较于Meta的Llama 3显得优越得多，后者则使用了16,384块更为高效的H100显卡且耗时54天。DeepSeek的这一成功不仅验证了其研发团队的能力，更是向业界证明了科技创新不一定需要依赖庞大的资金投入和高昂的硬件资源。

近期DeepSeek在AI技术领域的重大进展引发了更多的关注。1月20日，他们发布了DeepSeek-R1模型，并同步开源了模型权重。在后续的训练阶段，DeepSeek-R1大量采用了强化学习技术，尽管数据标注量极为有限，却大幅提升了模型的推理能力。菜场较OpenAI的o1正式版，这一成绩让DeepSeek的市场竞争地位进一步巩固。另一方面，在1月25日，AMD也宣布将新的DeepSeek-V3模型集成到其Instinct MI300X GPU上，意在通过这一强强联合实现最佳性能。

据中信证券的研究报告指出，DeepSeek的模型相较于GPT-4在参数量上更小，意味着推理成本也更低。这样明显的成本优势，或将推动AI应用的广泛普及。就如同4G网络的提速与降费推动了移动互联网的爆炸式发展，DeepSeek的性价比提升也将促进AI技术在更多领域的落地与应用。

通过这一系列的进展，可以预见，Agent模式——作为一种数字助手，将在企业管理、教育、金融等众多领域展现巨大的应用价值。DeepSeek的崛起意味着我国在人工智能的应用上愈发成熟，它将推动互联网用户的数字生活向更高的智能化、便捷化迈进。

根据财联社的不完全统计，目前A股市场上已经有多家公司与DeepSeek建立了关联与合作，这为中国的AI产业发展注入了活力。在未来的日子里，这个源自中国的科技公司将如何继续挑战行业的巨头，且不妨让我们拭目以待。证监会也将面临新的课题，如何在科技快速发展的背景下规范市场，为企业的发展保驾护航。

DeepSeek的突然兴起不仅是对Meta的重要挑战，更是引发了全球范围内对AI技术及其应用的重新审视。其令人瞩目的表现将推动整个行业在技术创新、成本控制及应用场景等多个维度的深刻变革，为未来智能时代的到来铸就基础。

DeepSeek一夜成名：美国科技巨头Meta为之恐慌，AI模型引发投资者关注

精品推荐

相关文章