DeepSeek“开源周”圆满收官发布多项创新开源项目

时间：2025-03-01 05:00

小编：小世评选

【】在经过五天紧张而充实的“开源周”活动后，DeepSeek今天宣布活动圆满收官。此次活动彰显了DeepSeek对开源生态的重视，持续为全球开发者社区带来显著的技术创新与实践分享。

2月28日，作为“开源周”的一天，DeepSeek发布了Fire-Flyer文件系统（3FS）和基于3FS的数据处理框架Smallpond。这标志着DeepSeek在开源旅程中迈出了重要的一步，向全球开发者开放了前沿技术。

Fire-Flyer文件系统（3FS）是一款结合现代SSD和RDMA网络的并行文件系统，旨在充分利用硬件的各项性能。其具备多项优越性能：在180节点集群中的聚合读取吞吐量高达6.6TiB/s，而在25节点的GraySort基准测试中则达到3.66TiB/min。每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s，确保了数据访问的高效性与可靠性。3FS独特的分解架构提供了强一致性语义，支持多种数据处理任务，包括数据集的加载、预处理、检查点保存和嵌入向量搜索等，为DeepSeek的数据处理提供了强有力的支撑。

Smallpond作为轻量级数据处理框架，基于DuckDB构建，其设计目的是提供高性能的数据处理和极高的可扩展性。这一框架可以在无需持续运行服务的情况下处理PB级别的数据集，极大方便了用户的操作，减少了资源的浪费。DeepSeek希望通过该框架，降低数据处理的门槛，让更多开发者能够涉足大数据的领域。

回顾整个“开源周”，DeepSeek的开源进程始于2月24日，连续发布了五个重要代码库。开幕之日，DeepSeek正式宣布开源FlashMLA，这是专为Hopper GPU设计的高效MLA解码内核，特别针对可变长度序列进行了性能优化，现已在多个商业项目中投入使用。DeepEP的推出标志着DeepSeek在MoE（Mixture of Experts）模型训练和推理上的创新，为开源社区提供了首个此类EP通信库。随后的DeepGEMM同时支持密集布局及两种MoE布局，展现了其在训练和推理方面的强大能力。而发布的Optimized Parallelism Strategies，针对困扰大规模模型训练的效率问题，提供了全新的解决方案。

自今年以来，DeepSeek的表现可圈可点，QuestMobile的数据统计显示，截至2月9日，DeepSeek App的累计下载量已超过1.1亿次，周活跃用户最高达9700万，这一成就不仅体现了DeepSeek的技术实力，同时也验证了用户对其产品的高度认可。

在“开源周”的成功举办后，DeepSeek还在加速开发其即将发布的DeepSeek-R2模型。尽管初步计划于今年5月发布，但根据最新消息，此模型可能会提前推出。DeepSeek-R2旨在提升代码生成能力，并支持多种语言的推理，这对推动整个AI领域的进步具有重要意义。DeepSeek母公司幻方量化也对此进行了回应，呼吁大家以官方消息为准，展示了对新项目的高度重视与期待。

行业观察人士也纷纷对DeepSeek-R2模型寄予厚望。印度科技服务商Zensar的首席运营官指出，这一新模型的发布或将成为AI行业的关键时刻，有潜力打破目前市场上的垄断格局。DeepSeek所开发的高性价比AI模型可能会推动更多企业加速其研发进程。

当下，市场中已涌现出多款深度推理和深度思考模型，OpenAI、谷歌、xAI、Anthropic等领导者纷纷推出新产品。而字节跳动旗下的AI助手豆包也被传正在进行小范围的深度思考模型测试。尽管DeepSeek模型尚未被接入这些新应用，但其技术进步的速度和方向会引起行业的高度关注和期待。

随着DeepSeek“开源周”的成功落幕，全球开发者社区迎来了新的发展契机。DeepSeek将继续致力于开源技术的探索与创新，推动高性能计算和AI技术的普及与应用，期待在未来的日子里，能够与更多开发者共同开拓更广阔的技术前景。