DeepSeek登顶美区App Store,AI市场热潮席卷全球
时间:2025-01-29 01:30
小编:小世评选
文/黄海峰的通信生活
在万家欢乐庆祝新年的时刻,DeepSeek却成为了人工智能(AI)领域的焦点。1月27日,DeepSeek不仅在美国地区的App Store中高居免费榜的首位,而其服务器在国内亦因用户涌入而短暂“宕机”,足见这一AI应用的火爆程度。
DeepSeek究竟是什么呢?在深入了解之前,让我们回顾一下它的辉煌历程。
DeepSeek成立于2023年5月,背靠的是中国知名对冲基金公司幻方量化的支持。2023年11月,它推出了首个开放源代码的AI模型——DeepSeek Coder,供商业使用同时又完全开放。DeepSeek LLM应运而生,其参数规模达67亿,性能接近于当时的AI领域标杆GPT-4,并推出了聊天版本的DeepSeek Chat。
随着时间的推移,DeepSeek的技术不断迭代升级。2024年初,DeepSeek团队推出了第二代MoE大模型DeepSeek-V2,该版本在性能上已经能够媲美GPT-4 Turbo,然而在价格上却仅属于GPT-4的1%。凭借这种出类拔萃的性价比,DeepSeek迅速崭露头角,吸引了众多用户的青睐。
随着研究的深入,2024年年底,DeepSeek推出了最新的人工智能大模型DeepSeek V3。其混合专家模型(MoE)参数规模达到6710亿,在多项基准测试中都表现出了优异的能力。继而到了2025年1月20日,DeepSeek再次发布了推理大模型DeepSeek-R1,特别是在数学、编程和推理等领域的表现可以与OpenAI的最强推理模型o1抗衡,但API调用成本却低了90%到95%。如此显著的经济优势,使得DeepSeek成为了很多企业和开发者的首选。
DeepSeek的火爆不仅仅局限于中国市场,国际上也开始引起了广泛关注。在美国,多位AI行业的专业人士对DeepSeek大模型给予了高度评价,微软CEO萨蒂亚·纳德拉表示DeepSeek成功地推出了一款开源模型,其推理计算效率异常高。而英伟达高级研究经理Jim Fan也称赞DeepSeek为非美国公司中真正推动开放和前沿研究的代表,切实延续了OpenAI最初的使命。
对于DeepSeek的成功,创始人梁文锋是其背后的重要推手。梁文锋1985年生于广东湛江,2002年进入浙江大学电子信息工程专业,随后继续深造获得硕士学位。早在2008年金融危机期间,他就探索了如何将机器学习技术应用于全自动量化交易。毕业后的他创办了多家公司,最终在2023年进入通用人工智能领域,成立了DeepSeek,并开始研究AI算法及模型结构。他提出的MLA(多头潜在注意力机制)和DeepSeek MoESparse结构,有效减少了模型计算需求与显存占用,并采取开源策略,推动了技术的进步与扩散。
不出所料,1月27日,DeepSeek凭借其优异的表现力压备受瞩目的ChatGPT,登顶美区App Store免费榜首,令纳斯达克100指数迷你期货同时下滑了300多点。在国内,DeepSeek更是带动了众多相关概念股的上涨,而与DeepSeek关联企业的股票也受到了正面的推动。随着用户访问量暴增,DeepSeek在26日和27日的服务器多次出现“宕机”,显示出其系统面临的巨大压力。对此,DeepSeek方面表示,虽然发生了局部服务波动,但问题在短时间内已得到解决。这种情况是由于用户对其新发布模型的热情导致的。
DeepSeek飞速发展的根本原因在于其对AI人才的广泛吸纳与重视。当前,DeepSeek正在进行实习生招聘,AGI大模型实习生的日工资为500元到1000元,数据百晓生的工资在500元到510元之间,显示出企业在人才投入方面的决心和信心。
通过DeepSeek在AI领域的迅猛发展,我们可以提炼出两个重要观察点:从全球科技竞争的角度来看,中国科技企业已在国际市场中扮演愈发重要的角色。TikTok和DeepSeek等的成功,彰显了中国企业在科技创新中的强大实力。全球科技竞争的激烈程度也在不断加剧。例如,美国于2025年初启动的“星际之门”AI基础设施计划,计划投入5000亿美元来建设数据中心和计算设施,这对中国企业而言既是机遇也是挑战。
展望未来,DeepSeek将如何在全球AI领域中进一步发展,会受到各界的广泛关注。其成功不仅依赖于卓越的技术创新,也需要在维护开放研究、吸引人才与迎接竞争中不断前行。正如DeepSeek所展现的那样,真正推动科技进步的,永远是持之以恒的探索与创新。