DeepSeek-R1崛起硅谷大模型竞技榜第三名引发科技界震动

时间：2025-01-27 04:10

小编：小世评选

潮新闻客户端记者张云山报道，近期，“神秘东方力量”DeepSeek在硅谷引发了一阵强烈的技术风潮。其最新推出的DeepSeek-R1模型，成功跻身大模型竞技榜第三名，与业界知名的ChatGPT-4o齐名，并且超越了Google Gemini、Microsoft Copilot等众多美国科技巨头的生成式AI产品。

深度关注：DeepSeek海外爆火

DeepSeek在海外市场的迅速崛起，令业内外人士惊叹不已。今日，该模型在正式发布后，突然遭遇了短暂的“闪崩”现象，许多用户在使用时遇到了“服务器繁忙”的提示。对此情况，DeepSeek官方迅速作出回应，确认当天下午确实出现了局部服务波动，但几分钟内就已解决。经过分析，问题的出现主要是由于新模型发布后，用户访问量暴增，导致服务器一度无法应对如此高的并发需求。尽管出现问题，官方状态页并未将此事件标记为事故，显示出其对系统稳定性的控制能力。

DeepSeek的崛起，得益于其低廉的成本和卓越的性能，吸引了包括众多硅谷科技巨头在内的密切关注。而在针对DeepSeek-R1的用户测试中，其胜率超过了80%，展现出其卓越的能力。

成功之路：技术创新与实践

回顾去年年底，DeepSeek推出的开源模型DeepSeek-V3曾在聊天机器人竞技场（Chatbot Arena）中排名第七，而在开源模型中排名第一，成为全球前十中性价比最高的模型。DeepSeek-V3的成功，得益于其核心技术创新，包括Multi-head Latent Attention（MLA）、混合专家架构（MoE）与FP8低精度训练三项技术，这些技术的结合显著提升了模型的性能和效率。

进入2024年，DeepSeek正式发布R1推理模型，1月24日，该模型在Chatbot Arena综合榜单上的排名高达第三，与OpenAI的顶尖模型o1并列。在应对高难度提示词、编程任务以及复杂数学问题等技术性极强的领域，DeepSeek-R1表现出色，甚至在多个测试中与o1并列第一。

值得一提的是，DeepSeek-V3的训练成本仅为558万美元，远低于训练成本高达7800万美元的GPT-4。同时，其API服务价格也继承了公司一贯的亲民政策，每百万输入tokens只需0.5元（缓存命中）或2元（缓存未命中），输出tokens的成本也仅为每百万8元。

科技巨头的惊慌反应

近日，加州伯克利大学的研究团队成功以低于30美元的成本复现了DeepSeek R1-Zero的关键技术——顿悟时刻，进一步验证了DeepSeek在技术创新上的领先地位。

《金融时报》称DeepSeek为国际科技界的震惊黑马，认为其性能与资金雄厚的OpenAI等美国竞争对手不相上下。Maginative创始人Chris McKay预测，DeepSeek-V3的成功将重新定义AI模型开发的既定方法。

而在社交媒体上，一条关于Meta员工的帖子引起广泛关注，该员工透露Meta内部已因DeepSeek模型的优越性能而进入“恐慌模式”。他提到，“DeepSeek-V3在基准测试中已经让Llama 4相形见绌，这让我们的工程师们不得不争分夺秒地分析DeepSeek，试图复制其中的技术。”

Metal CEO扎克伯格、图灵奖得主Yann LeCun以及DeepMind CEO Demis Hassabis等业内领袖纷纷对DeepSeek表示高度评价，显示出该公司在行业中的影响力。

在DeepSeek崛起的背景下，OpenAI CEO Sam Altman也试图通过新产品o3-mini的使用额度发布，再次抢占媒体的焦点，显示出国际科技竞争的白热化程度。

展望未来：AI行业的变革

成立于2023年7月17日的DeepSeek，正式名称为杭州深度求索人工智能基础技术研究有限公司，致力于开发先进的大语言模型（LLM）和相关技术。随着DeepSeek-R1的成功推出，AI行业的格局或将迎来新的变革。

DeepSeek的崛起，不仅为全球科技圈带来了新的竞争压力，同时也丰富了AI技术的生态系统。在未来，如何保持技术创新、控制成本及提升用户体验，将是DeepSeek及整个行业需要共同面对的挑战与机遇。

DeepSeek-R1崛起硅谷大模型竞技榜第三名引发科技界震动

精品推荐

相关文章

DeepSeek-R1崛起硅谷 大模型竞技榜第三名引发科技界震动

精品推荐

相关文章

DeepSeek-R1崛起硅谷大模型竞技榜第三名引发科技界震动