AMD发布DeepSeek-V3模型，称其超越GPT-4o

时间：2025-02-05 16:10

小编：小世评选

2024年2月5日，AMD首次向外界展示了其最新的大型语言模型（LLM）——DeepSeek-V3，并将其集成在其最新的Instinct MI300X GPU上。近年来，随着人工智能技术的快速发展，尤其是在自然语言处理领域，各大公司纷纷推出自家的语言模型，竞争日趋激烈。AMD此次推出的DeepSeek-V3不仅在技术上实现了巨大的突破，还在性能测评中被AMD自信地称为超越了众所周知的GPT-4o。

据AMD官方介绍，DeepSeek-V3是该公司迄今为止开发的最强开源LLM，其设计目标旨在通过优化与SGLang的协作来达到最佳性能表现。这意味着，该模型不仅在算法上进行了革新，同时在运行效率上也有显著提升，从而能够充分发挥硬件的强大计算能力。

在实际应用中，DeepSeek-V3与SGLang的协同工作让开发者能够实现更高效的编程体验，处理复杂语言任务时的响应速度和准确性大幅提升。AMD特别指出，这一版本的DeepSeek模型支持FP8格式，使得模型能在NVIDIA和AMD的GPU上无缝运行，为开发者提供了一个更加灵活的选择。这为开发者和AI行业带来了更多可能性，尤其是在构建需要高性能计算资源的应用时。

值得一提的是，DeepSeek-R1自发布以来，仅用几天便在中美两区的苹果应用市场的免费榜单上取得佳绩，显示出其在用户中的受欢迎程度。得益于该模型稳定的性能和开源的特性，许多科技巨头如亚马逊、微软等已宣布将接入DeepSeek模型，这也反映了业界对这一技术的认可。

更加引人注目的是，曾经扬言要对DeepSeek采取法律行动的Open似乎已经改变了态度。OpenAI首席执行官萨姆·奥尔特曼在东京出席活动时表示，公司并不会对DeepSeek采取起诉行动，反而称赞这个新的竞争者并强调OpenAI将继续专注于开发优秀的产品。“DeepSeek是一个令人印象深刻的模型，我们对新的竞争感到兴奋，”奥尔特曼表示。这样的转变不仅突显了DeepSeek的实力，也彰显了人工智能领域竞争的良性发展。

AMD的DeepSeek-V3模型除了提升性能，其开源特性得到了更加广泛的重视。开源不仅意味着透明度和自由使用，更可以加速人工智能领域的创新与发展。开发者们可以在DeepSeek的基础上进行二次开发，结合自身需求，创造出更加符合市场需求的产品。

同时，AMD也对与美团搜索与推荐算法团队的合作表示了感谢，认为他们在模型的开发中提供了重要的GPU资源支持。DataCrunch的贡献也让DeepSeek-V3得以在更广泛的计算环境中发挥其潜力。这种跨行业的合作模式，不仅促进了技术的进步也为行业带来了更多的机遇。

AMD发布的DeepSeek-V3模型不仅在技术和性能方面实现了突破，更在业界引起了广泛的关注。作为新一代开源LLM，它将为开发者提供强大的支持，同时也将推动整个人工智能行业的持续进步。随着更多科技公司加入到这一竞争中，未来的市场可谓是风云变幻，值得期待。无论是对用户体验的提升，还是对技术创新的促进，DeepSeek-V3将成为一个新的里程碑，开启更多可能性的大门。

随着DeepSeek-V3的发布，AMD不仅展现了其在AI领域的决心与愿景，更预示着一个新的竞争时代正在开启。未来AI技术的迅猛发展，将进一步推动我们社会的进步与变革。希望在不久的将来，用户能够享受到更多高效、智能的AI产品与服务。

AMD发布DeepSeek-V3模型，称其超越GPT-4o

精品推荐

相关文章