国产大模型DeepSeek登顶美中应用商店免费APP下载榜超越ChatGPT

时间：2025-01-28 17:30

小编：小世评选

1月27日，国产大模型公司杭州深度求索推出的DeepSeek应用在苹果中国地区和美国地区的应用商店免费APP下载排行榜上实现了重大突破，成功登顶，并在美国市场超越了著名的ChatGPT。这一成就标志着DeepSeek在全球AI应用领域的崛起，同时也为国产大模型的发展注入了新的动力。

作为一家专注于人工智能技术研发的企业，深度求索是量化巨头幻方量化下的全新子公司。该公司于1月20日正式发布了其首款推理大模型——DeepSeek-R1。该模型一经推出，便凭借其“物美价廉”的特性在外部开发者社区中引发了广泛关注和讨论。DeepSeek-R1是一款开源模型，其在数学、编程、自然语言推理等各个任务上的性能表现已接近OpenAI最新的o1模型，令人刮目相看。

DeepSeek-R1的开发背景得益于其低廉的训练成本与出色的性能表现，根据公司透露，R1的预训练费用仅为557.6万美元，且在2048块针对中国市场的低配版英伟达H800 GPU集群上经过55天的训练完成。这一成本之低仅为OpenAI GPT-4o模型训练费用的不到十分之一，充分体现了DeepSeek在技术研发上的成本控制能力。

在模型的后训练阶段，DeepSeek采用了大规模强化学习技术，通过极少的标注数据显著提升了模型的推理能力。这一创新的训练方式与传统依赖监督微调的模式相比，是一次颠覆性的突破。该公司的研究显示，DeepSeek-R1在基准测试中的表现已经晋升至全类别大模型的第三位，并在风格控制类模型（StyleCtrl）分类中与OpenAI的o1模型并列第一，进一步印证了该模型的重要性和市场竞争力。

令人瞩目的是，DeepSeek也将其训练过程、技术与成果全部公开，通过这种开放的形式，不仅促进了社区的学习与发展，也为用户提供了训练自己模型的机会。DeepSeek还特别蒸馏了六个小模型，以方便社区的开发者进行进一步的应用与研究。

对此，英伟达的高级研究科学家Jim Fan在一篇评论中表示，DeepSeek-R1可能是“首个展示了RL（强化学习）飞轮可以发挥作用且能带来持续增长的OSS（开源软件）项目”。他进一步解释，飞轮的概念在于AI系统中自我强化与正向循环的过程，令人对DeepSeek的未来充满期待。

Jim Fan在文章中提到，“我们正处于一个奇妙的时间点，一家非美国公司正在践行OpenAI最初的使命，推动真正开放的前沿研究，并实现让所有人受益的目标。这种状况的出现简直令人难以置信，而最有趣的结果反而也可能是最具潜力和可能性的结果。”

DeepSeek的崛起不仅让人们看到国产AI大模型在国际市场上的竞争力，也反映了中国在科技创新方面逐渐走向全球前沿。随着DeepSeek取得的成功，国内其他AI公司也将受到鼓舞，积极探索开源技术与创新商业模式，进一步推动整个行业的进步。随着用户的反馈与社区的参与，DeepSeek也将不断优化自身的产品，提升用户体验。

DeepSeek的成功不仅是技术上的突破，也是市场运作与战略布局的胜利。在这波AI浪潮中，深度求索凭借其开源模型带来的巨大经济效益和应用潜力，必将吸引越来越多的开发者和企业加入到这一领域中，共同推动人工智能技术的发展与应用。

随着AI技术的迅猛发展，竞争必然加剧，而DeepSeek在此次下载榜单上的成功也意味着国产大模型的发展迎来了新的机遇。无论是国际化布局，还是技术的持续创新，DeepSeek都将继续引领国产AI在全球市场的探索与实践，为人类社会的持续进步贡献力量。