免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > DeepSeek-R1崛起硅谷 大模型竞技榜第三名引发科技界震动

DeepSeek-R1崛起硅谷 大模型竞技榜第三名引发科技界震动

时间:2025-01-27 04:10

小编:小世评选

潮新闻客户端记者张云山报道,近期,“神秘东方力量”DeepSeek在硅谷引发了一阵强烈的技术风潮。其最新推出的DeepSeek-R1模型,成功跻身大模型竞技榜第三名,与业界知名的ChatGPT-4o齐名,并且超越了Google Gemini、Microsoft Copilot等众多美国科技巨头的生成式AI产品。

深度关注:DeepSeek海外爆火

DeepSeek在海外市场的迅速崛起,令业内外人士惊叹不已。今日,该模型在正式发布后,突然遭遇了短暂的“闪崩”现象,许多用户在使用时遇到了“服务器繁忙”的提示。对此情况,DeepSeek官方迅速作出回应,确认当天下午确实出现了局部服务波动,但几分钟内就已解决。经过分析,问题的出现主要是由于新模型发布后,用户访问量暴增,导致服务器一度无法应对如此高的并发需求。尽管出现问题,官方状态页并未将此事件标记为事故,显示出其对系统稳定性的控制能力。

DeepSeek的崛起,得益于其低廉的成本和卓越的性能,吸引了包括众多硅谷科技巨头在内的密切关注。而在针对DeepSeek-R1的用户测试中,其胜率超过了80%,展现出其卓越的能力。

成功之路:技术创新与实践

回顾去年年底,DeepSeek推出的开源模型DeepSeek-V3曾在聊天机器人竞技场(Chatbot Arena)中排名第七,而在开源模型中排名第一,成为全球前十中性价比最高的模型。DeepSeek-V3的成功,得益于其核心技术创新,包括Multi-head Latent Attention(MLA)、混合专家架构(MoE)与FP8低精度训练三项技术,这些技术的结合显著提升了模型的性能和效率。

进入2024年,DeepSeek正式发布R1推理模型,1月24日,该模型在Chatbot Arena综合榜单上的排名高达第三,与OpenAI的顶尖模型o1并列。在应对高难度提示词、编程任务以及复杂数学问题等技术性极强的领域,DeepSeek-R1表现出色,甚至在多个测试中与o1并列第一。

值得一提的是,DeepSeek-V3的训练成本仅为558万美元,远低于训练成本高达7800万美元的GPT-4。同时,其API服务价格也继承了公司一贯的亲民政策,每百万输入tokens只需0.5元(缓存命中)或2元(缓存未命中),输出tokens的成本也仅为每百万8元。

科技巨头的惊慌反应

近日,加州伯克利大学的研究团队成功以低于30美元的成本复现了DeepSeek R1-Zero的关键技术——顿悟时刻,进一步验证了DeepSeek在技术创新上的领先地位。

《金融时报》称DeepSeek为国际科技界的震惊黑马,认为其性能与资金雄厚的OpenAI等美国竞争对手不相上下。Maginative创始人Chris McKay预测,DeepSeek-V3的成功将重新定义AI模型开发的既定方法。

而在社交媒体上,一条关于Meta员工的帖子引起广泛关注,该员工透露Meta内部已因DeepSeek模型的优越性能而进入“恐慌模式”。他提到,“DeepSeek-V3在基准测试中已经让Llama 4相形见绌,这让我们的工程师们不得不争分夺秒地分析DeepSeek,试图复制其中的技术。”

Metal CEO扎克伯格、图灵奖得主Yann LeCun以及DeepMind CEO Demis Hassabis等业内领袖纷纷对DeepSeek表示高度评价,显示出该公司在行业中的影响力。

在DeepSeek崛起的背景下,OpenAI CEO Sam Altman也试图通过新产品o3-mini的使用额度发布,再次抢占媒体的焦点,显示出国际科技竞争的白热化程度。

展望未来:AI行业的变革

成立于2023年7月17日的DeepSeek,正式名称为杭州深度求索人工智能基础技术研究有限公司,致力于开发先进的大语言模型(LLM)和相关技术。随着DeepSeek-R1的成功推出,AI行业的格局或将迎来新的变革。

DeepSeek的崛起,不仅为全球科技圈带来了新的竞争压力,同时也丰富了AI技术的生态系统。在未来,如何保持技术创新、控制成本及提升用户体验,将是DeepSeek及整个行业需要共同面对的挑战与机遇。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多