DeepSeek 数据提取争议引发 AI 界风波，微软与 OpenAI 关系再受考验

时间：2025-01-30 07:20

小编：小世评选

春节假期期间，DeepSeek引发了一场引人注目的风波，震动了整个人工智能（AI）圈。根据彭博社的最新报道，微软的安全研究团队在去年的秋季发现了一些与DeepSeek可能有关的个人，涉嫌通过OpenAI的API进行大规模数据提取。这一事件不仅引发了广泛的关注，同时也让微软与OpenAI之间的合作关系再度受到考验。

知情人士透露，作为OpenAI的技术合作伙伴和最大金主，微软在发现这些异常活动后，立即将情况通报给了OpenAI。报告中指出，这种数据提取行为可能违反了OpenAI的服务条款，后者明确规定用户不得未经授权使用任何自动化或程序化方法从其服务中提取数据。即便DeepSeek似乎曾获得某种API访问权限，但如果其使用超出OpenAI授权的范围，例如用于不当或未授权的商业目的，也显然构成了对服务条款的严重违反。

对此，OpenAI没有作出回应，而微软也拒绝对此事发表意见，DeepSeek方面亦未作出回应。不过，这并不是争议的全部。早前，有外界人士提出质疑，认为DeepSeek可能在训练其模型时使用了ChatGPT等其他模型的输出数据，而这些数据的「知识」随后被迁移到了DeepSeek自家的模型中。在AI领域，这种做法并不罕见，但问题的关键在于DeepSeek是否在未充分披露的情况下使用了OpenAI的输出数据。而这一点似乎在DeepSeek-V3的自我介绍中有所体现，之前就有用户询问其身份时，DeepSeek出现了将自己误认为是GPT-4的情况。

DeepSeek在其最新的R1模型技术报告中坚称并未使用来自OpenAI的输出数据，并指出通过强化学习及独特的训练策略达成了优良的性能水平。他们采用的多阶段训练方式，涵盖了基础模型训练、强化学习训练和微调，这种循环过程有助于模型在不同阶段汲取多种知识与能力。

随着事件的发展，美国AI事务主管David Sacks在接受Fox News采访时表示，DeepSeek“有确凿的证据”显示其利用了OpenAI模型的输出数据来进行自身技术的开发。不过，Sacks并未提供任何具体证据，这也使得事情的真相变得模糊。近期，多位美国官员对DeepSeek提出了“偷窃”嫌疑，并启动了国家安全调查。

对此，OpenAI的反应显得相对谨慎。其发言人指出，“我们知道，来自中国的公司及其他一些企业，始终在尝试‘蒸馏’美国领先AI公司的模型。”这一言论强调了OpenAI作为行业领头羊在知识产权保护上的关注，并重申了与美国的紧密合作对于保护先进AI模型的重要性。

在争议持续发酵的同时，外界的目光又开始聚焦于DeepSeek更早发布的开源V3模型。该模型通过技术报告披露了深层次的底层优化细节，引发了更大的关注。报道指出，V3模型的开发甚至绕过了CUDA，直接对NVIDIA GPU的低级汇编语言PTX进行了优化，旨在实现更高的性能。

PTX作为NVIDIA GPU的中间指令集架构，能够实现细粒度的优化，包括寄存器分配、线程通信等。相比之下，CUDA更像是开发者与GPU对话的“高级语言”。如果CUDA是玩家使用手柄游戏，PTX就像是打开游戏机机壳，允许开发者直接调整内部配件和线路，以实现最大性能。这一过程虽然复杂，需具备深厚的专业知识，但也大幅提升了性能。

DeepSeek在V3模型训练中，对H800 GPU进行了重新配置，包括划分出了20个SM以供服务器间通信，并实现了流水线算法，这些优化远超常规CUDA开发的水平。如果这些技术确实得以实现，可能会对NVIDIA所建立的护城河构成冲击。

尽管PTX带来了显著的性能提升，但对开发团队却提出了更高的要求，相比之下，CUDA在开发便捷性与快速迭代的优势上，仍然是多数开发者的首选。更为重要的是，PTX优化往往需针对特定硬件量身定制，这种“量体裁衣”的优化方式虽然效果显著，但显著提高了开发和维护的难度。因此，在可预见的未来，CUDA仍有可能在主流开发中占据主导地位。

寻求突破固然艰难，但历史上许多颠覆性创新的开始，往往源于对既有规则的挑战。DeepSeek此番在技术上的先锋探索，将可能对整个AI产业链的现有秩序产生深远的影响。随着事件的发展和潜在的技术进步，AI圈的未来值得广泛关注。

DeepSeek 数据提取争议引发 AI 界风波，微软与 OpenAI 关系再受考验

精品推荐

相关文章