DeepSeek推出新款开源AI模型R1,与OpenAI竞争成本低90%
时间:2025-01-23 11:10
小编:小世评选
近日,中国的AI公司DeepSeek(深度求索)发布了其全新开源AI模型R1,这一事件引起了全球科技界的广泛关注。据悉,DeepSeek R1在性能上虽然与美国顶尖的AI模型还有一定差距,但在成本上则表现出惊人的优势——其成本比OpenAI的类似模型低达90%。
回顾去年的发展,DeepSeek在12月推出了DeepSeek V3开源大语言模型,该模型在性能上与OpenAI的GPT-4和Anthropic的Claude 3.5非常接近,同时其训练成本却仅为560万美元。这与OpenAI、谷歌、Anthropic等公司在数亿美元的花费上形成了鲜明的对比,每个公司为了推出下一代模型的投入可能会达到数十亿。DeepSeek董事会成员Andrej Karpathy曾表示,V3的投资是“低得有些荒谬”,这一点反映了中国在AI领域的创新与高效。
DeepSeek的创始人兼CEO梁文锋在去年的采访中提到,虽然资金不是问题,但先进芯片的供应受到限制。V3模型是基于Nvidia H800芯片训练的,而后美国对Nvidia H800的禁令使中国AI企业面临更大的挑战。
随着DeepSeek R1的到来,其性能在AI研究和应用上再次取得了新的突破。R1的推出不仅与OpenAI的o1 Turing模型在多个领域展开竞争,还在创新与成本上展现出更大的潜力。例如,DeepSeek R1在数学、编程和逻辑推理等多个领域的表现优秀,且成本相对低廉。外界普遍认为,DeepSeek R1的推出标志着开源模型的重大进展,开源与闭源模型之间的差距正在迅速缩小。
在外媒针对R1的评价中,多项数据的对比说明了R1的竞争力。比如在最近的AIME2024数学测试中,DeepSeek R1取得了79.8%的成绩,超越了OpenAI o1的79.2%。在Codeforces的测试中,DeepSeek R1的得分达到了2029,超过了96.3%的测试者,显示出较高的性能和竞争力。相比之下,OpenAI的每百万tokens输入成本约为15美元,输出成本为60美元,而DeepSeek R1分别仅为0.55美元和2.19美元。R1所采用的“Inference-time reasoning approach”在逻辑推理阶段的应用,使得其在完成更复杂的任务时能够展现与人类更为相似的思维能力。
DeepSeek还推出了R1-Zero版本,虽然在创造性推理方面表现出色,具备独立发现和自我反思的能力,但在可读性和结果的连贯性上不及R1。而R1在可读性和精确性上取得了较好的平衡,满足了现实应用中的各类需求,保证了用户体验的提升。
不仅仅是DeepSeek,其他中国科技企业如阿里巴巴、Kimi等也相继发布了与o1具有可比性的AI模型,显示出中国在AI领域的快速进步。乔治梅森大学的一位AI研究人员Dean Ball表示,DeepSeek的小模型(R1的小号版本)展现出的性能既惊人又让人充满期待,未来将会有更多具备推理能力的模型涌现,这些模型可以在本地硬件上进行处理,从而降低了技术门槛。
当我们回顾2017年苹果推出iPhone X时,其999美元的售价引发了手机市场的巨大反响,DeepSeek的R1以极低的成本和相对强大的性能则可能在AI市场中产生类似的影响。我们可以想象一下,如果有一款手机在性能上超越当前市场上最流行的产品,但售价仅为30美元,这将如何改变市场格局。
随着DeepSeek R1的发布,AI领域正经历一场前所未有的变革。DeepSeek的成功说明,在推动AI发展的过程中,尤其是在训练基本模型时存在着一些新的、可行的方法,这些方法在技术上可以取得与顶尖技术相当,成本却低得多。未来,随着成本的降低和效率的提升,将会有更多的应用程序进入市场,使得AI在实体经济中的应用潜力得以释放与扩展。
对于DeepSeek和类似公司而言,AI的发展不仅关乎技术的突破,更关乎如何有效利用资源,以更低的成本实现更多的创新。随着R1模型的推出,DeepSeek将继续推动AI技术的发展,并为全球市场带来更多的可能性。