DeepSeek推出新款开源AI模型R1，与OpenAI竞争成本低90%

时间：2025-01-23 11:10

小编：星品数码网

近日，中国的AI公司DeepSeek（深度求索）发布了其全新开源AI模型R1，这一事件引起了全球科技界的广泛关注。据悉，DeepSeek R1在性能上虽然与美国顶尖的AI模型还有一定差距，但在成本上则表现出惊人的优势——其成本比OpenAI的类似模型低达90%。

回顾去年的发展，DeepSeek在12月推出了DeepSeek V3开源大语言模型，该模型在性能上与OpenAI的GPT-4和Anthropic的Claude 3.5非常接近，同时其训练成本却仅为560万美元。这与OpenAI、谷歌、Anthropic等公司在数亿美元的花费上形成了鲜明的对比，每个公司为了推出下一代模型的投入可能会达到数十亿。DeepSeek董事会成员Andrej Karpathy曾表示，V3的投资是“低得有些荒谬”，这一点反映了中国在AI领域的创新与高效。

DeepSeek的创始人兼CEO梁文锋在去年的采访中提到，虽然资金不是问题，但先进芯片的供应受到限制。V3模型是基于Nvidia H800芯片训练的，而后美国对Nvidia H800的禁令使中国AI企业面临更大的挑战。

随着DeepSeek R1的到来，其性能在AI研究和应用上再次取得了新的突破。R1的推出不仅与OpenAI的o1 Turing模型在多个领域展开竞争，还在创新与成本上展现出更大的潜力。例如，DeepSeek R1在数学、编程和逻辑推理等多个领域的表现优秀，且成本相对低廉。外界普遍认为，DeepSeek R1的推出标志着开源模型的重大进展，开源与闭源模型之间的差距正在迅速缩小。

在外媒针对R1的评价中，多项数据的对比说明了R1的竞争力。比如在最近的AIME2024数学测试中，DeepSeek R1取得了79.8%的成绩，超越了OpenAI o1的79.2%。在Codeforces的测试中，DeepSeek R1的得分达到了2029，超过了96.3%的测试者，显示出较高的性能和竞争力。相比之下，OpenAI的每百万tokens输入成本约为15美元，输出成本为60美元，而DeepSeek R1分别仅为0.55美元和2.19美元。R1所采用的“Inference-time reasoning approach”在逻辑推理阶段的应用，使得其在完成更复杂的任务时能够展现与人类更为相似的思维能力。

DeepSeek还推出了R1-Zero版本，虽然在创造性推理方面表现出色，具备独立发现和自我反思的能力，但在可读性和结果的连贯性上不及R1。而R1在可读性和精确性上取得了较好的平衡，满足了现实应用中的各类需求，保证了用户体验的提升。

不仅仅是DeepSeek，其他中国科技企业如阿里巴巴、Kimi等也相继发布了与o1具有可比性的AI模型，显示出中国在AI领域的快速进步。乔治梅森大学的一位AI研究人员Dean Ball表示，DeepSeek的小模型（R1的小号版本）展现出的性能既惊人又让人充满期待，未来将会有更多具备推理能力的模型涌现，这些模型可以在本地硬件上进行处理，从而降低了技术门槛。

当我们回顾2017年苹果推出iPhone X时，其999美元的售价引发了手机市场的巨大反响，DeepSeek的R1以极低的成本和相对强大的性能则可能在AI市场中产生类似的影响。我们可以想象一下，如果有一款手机在性能上超越当前市场上最流行的产品，但售价仅为30美元，这将如何改变市场格局。

随着DeepSeek R1的发布，AI领域正经历一场前所未有的变革。DeepSeek的成功说明，在推动AI发展的过程中，尤其是在训练基本模型时存在着一些新的、可行的方法，这些方法在技术上可以取得与顶尖技术相当，成本却低得多。未来，随着成本的降低和效率的提升，将会有更多的应用程序进入市场，使得AI在实体经济中的应用潜力得以释放与扩展。

对于DeepSeek和类似公司而言，AI的发展不仅关乎技术的突破，更关乎如何有效利用资源，以更低的成本实现更多的创新。随着R1模型的推出，DeepSeek将继续推动AI技术的发展，并为全球市场带来更多的可能性。

DeepSeek推出新款开源AI模型R1，与OpenAI竞争成本低90%

精品推荐

相关文章