DeepSeek AI智能助手登顶中美iOS免费应用榜单,引发行业热议
时间:2025-01-28 20:20
小编:小世评选
图片来源:界面图库
界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪
1月27日,DeepSeek AI智能助手在中美iOS免费应用排行榜上双双登顶,这是中国企业首次获得这一成就。这一事件引发了行业内外的广泛热议,相关关键词纷纷登上微博热搜,诸如“DeepSeek彻底爆发”更是引发了对中国大模型公司崛起的讨论。许多人认为,中国产业正在赶超Open在开源领域撼动以闭源为主的行业格局。
DeepSeek的“爆发”是否如想象中那般猛烈?从表面看,DeepSeek在这段时间内并没有实施特别大的举措。这股舆论热潮的形成,主要是受到Meta的影响。大约三天前,一位Meta员工在职场社交teamblind上表示,DeepSeek最近的表现令Meta的生成式AI团队感到恐慌,后者无法解释其高额的研发预算。Meta的工程师们开始疯狂分析DeepSeek,希望能从中复制成功要素。
而Meta首席人工智能科学家杨立昆(Yann LeCun)也在社交媒体上发声,强调“开源模型正在超越闭源模型”,这一表态显然是对DeepSeek在开源领域表现的直接回应。事实上,自DeepSeek-V2问世以来,便已在硅谷内部被视作“东方的神秘力量”。它引领了国内大模型行业早期的“降价潮”,通过“MoE+MLA”结构创新打破了价格对标。
DeepSeek的广泛关注源于其近期发布的两款大模型产品,DeepSeek-V3和R1。针对2024年底发布的DeepSeek-V3,其包含6710亿参数,370亿激活参数,并在14.8万亿token上进行了预训练,表现上已经接近当前最优秀的Claude-3.5-Sonnet-1022,且在各种知识类任务上有所领先。深受注目的不仅是其庞大的参数规模,还有其训练成本,达557.6万美元,几乎是同等性能模型训练成本的十分之一。
1月20日发布的R1模型同样吸引了广泛关注。R1的性能类似于OpenAI的o1版本,在数学、代码及自然语言推理等任务上表现优异,颇具竞争力。其推出的同时,DeepSeek更是开源了模型权重,这让更多开发者能够接触到这一最新技术,从而促使了更为广泛的应用与反馈。
DeepSeek-R1的推出也展示了其针对推理能力的创新探索,如通过强化学习训练其推理能力,这种模式使其在长链推理和自我反思等方面展现出独特的“自我进化”能力。尽管其在运行过程中面临语言可读性较差的问题,但这也为今后的模型改进提供了研究基础。
尽管DeepSeek的表现获得了业界的赞誉,但投资者们对此保持谨慎。一位大模型行业投资人告诉记者,虽然DeepSeek-V3在当前可以说是最优秀的开源模型,但声称能立即与头部闭源模型竞争仍显得有些为时尚早。随着GPT-4的发展迅速,DeepSeek仍面临着巨大的创新压力;国内外的竞争并不会减弱。
实际上,这波热议的另一驱动因素在于DeepSeek战略上推出用户智能助手应用,向公众直观展示其技术的价值。这种贴近用户的方式不仅拉近了与用户的距离,更使得许多人对其产品感到惊艳,社交媒体上的用户分享更是推动了这一热潮。
从发展历程来看,DeepSeek所展现的,不仅仅是一个开源技术的突破,更是构建起了一种新型的企业组织和创新模式,使行业意识到高效扁平化的团队结构在大模型研发中的重要性。随着Meta CEO扎克伯格宣布2025年将投资超过600亿美元于相较而言,DeepSeek的低成本、高效率模式显得越发珍贵。
在此背景下,DeepSeek在中国AI产业中占据了越来越重要的地位,其创业理念、技术实力和市场表现表明,中国公司完全能够与OpenAI、Meta等封闭模型公司一较高下。而这种商业模式的成功实例,可能会引领更多中国产业界参与到全球人工智能竞争之中。
在未来,DeepSeek的目标并不是仅限于赢得市场份额,更重要的是希望成为一个人工智能领域的贡献者,为行业的发展提供新的思路与动力。创始人梁文峰曾提到,随着中国经济的发展,产业的贡献者角色必不可少,而DeepSeek正是这一转变的重要参与者。