中国AI公司DeepSeek发布新模型,震撼全球科技界
时间:2025-01-31 03:40
小编:小世评选
【文/观察者网 陈思佳】在全球人工智能(AI)行业中,中国公司深度求索(DeepSeek)最近推出的DeepSeek-R1模型成为了一个重要的里程碑。这一新模型以极低的成本达到了与美国顶尖AI模型相媲美的效果,立即引起了行业内外的广泛关注和赞誉。许多专家和分析师感叹道,DeepSeek的创新举措不仅让硅谷感到震惊,更有可能重新定义大规模模型的研发规则与市场结构。
随着DeepSeek的迅速崛起,其创始人梁文锋的个人故事也越来越被外界所关注。作为一个17岁便考入浙江大学的年轻才俊,梁文锋在量化投资与人工智能领域取得了颇为显著的成就,但他一直保持低调,鲜少显露于公众视野。公众不禁好奇,这位“学霸”创业者背后有哪些鲜为人知的成功秘笈。
梁文锋1985年生于广东省湛江市,2002年以优异的成绩进入浙江大学电子信息工程专业,并于2010年获得信息与通信工程硕士学位。在校期间,他对金融市场的兴趣逐渐加深。尤其是在2008年全球金融危机期间,他和团队开始尝试用机器学习技术分析市场数据,以实现自动化的量化交易,奠定了其后续职业生涯的基础。
毕业后,梁文锋首次投身于金融行业。2013年,他与同学徐进共同建立了杭州雅克比投资管理有限公司,随后于2015年创办了杭州幻方科技有限公司,专注于借助数学和AI进行量化投资。2016年,幻方推出了首个基于深度学习的交易模型,并逐步吸引了更多计算资源,以提升量化投资的智能化水平。到2018年,幻方的投资决策已全面实现AI化,反映了他在AI算法研究和应用上的卓越贡献。
随着公司业务快速发展,梁文锋意识到计算资源的不足,并在2019年自主研发了“萤火一号”训练,持续投入巨额资金扩充计算能力。不可否认,幻方在2018年获得的私募金牛奖以至于梁文锋的主题演讲“量化投资的未来在于技术提升市场效率”,均体现了他在行业中的引领地位。
对于深度求索的创建,梁文锋在2023年正式切入通用人工智能领域。他和团队通过精简的结构和创新的技术,迅速获得了重大成就。DeepSeek的团队虽然只有139名成员,相较于OpenAI的1200名,却在短时间内推出了多款引人注目的模型。2024年发布的DeepSeek-V2因其极具竞争力的API定价而快速引起市场关注,甚至引发国内大厂间的“价格战”。
更为重要的是,DeepSeek发布的DeepSeek-V3模型在多项评测中超越了其他开源模型及顶级闭源模型,显示其出色的研发能力和技术实力。尤其值得注意的是,DeepSeek-V3的成本仅约557.6万美元,相较于OpenAI的模型其成本更低,显示了其极大的经济性。
在即将发布的DeepSeek-R1模型中,更是通过强化学习技术和极少标注数据的应用,极大提升了模型的推理能力。美国OpenAI创始成员之一安德烈·卡帕西对DeepSeek的工程能力表示高度赞赏,认为这一突破将改变未来AI模型的研发。
梁文锋一直认为创新需要摆脱传统惯性,他对团队的管理有自己独特的看法。他的团队主要由年轻程序员组成,这些人大部分来自于顶尖高校,具有新鲜的视角和想法。虽然这些年轻人成员没有丰富的行业经验,但梁文锋坚信,保持好奇心和创新精神才是推动技术进步的关键。同时,他指出,开源文化和共享技术至关重要,他希望自己的团队能够为全球的AI发展贡献力量。
梁文锋所代表的DeepSeek不仅在技术上展现出卓越的能力,在文化和理念上也传递了对AI发展的深思。他强调,中国在AI领域不应仅仅是跟随者,而应当积极参与全球技术的前线,成为新的贡献者。他的坚持与信念或将推动中国AI行业朝着更为快速和可持续的方向发展。