免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 国产AI新星DeepSeek掀动硅谷与华尔街,发布全新开源多模态模型

国产AI新星DeepSeek掀动硅谷与华尔街,发布全新开源多模态模型

时间:2025-01-29 15:40

小编:小世评选

一只蓝色鲸鱼,正以惊人的速度掀起波澜,令硅谷和华尔街的投资者们不得不重新思考未来的科技格局。根据最新消息,国产AI企业DeepSeek日前发布了全新的开源多模态AI模型,迅速引起了业内及投资者的广泛关注,甚至波及到美股市场。

自1月28日DeepSeek首次引起注意以来,这一"国产AI之光"已成为主流媒体的热议话题。随着公司发布的新模型吸引了大量关注,美股科技股的表现几乎遭遇了滑铁卢,尤其是以英伟达为首的芯片股受到重创。DeepSeek新发布的模型R1以前所未有的高性能和极高的性价比,赢得了“AI价格屠夫”的称号。

这一模型的发布引发了OpenAI创始人Sam Altman的关注,他在社交上对此表示赞赏。Altman称DeepSeek R1是一款“令人印象深刻的模型”,并警告AI行业应更加重视未来计算能力的提高。他的这番言论显然是在回应DeepSeek带来的激烈竞争,显示出OpenAI对这一新兴力量的重视。

DeepSeek此次发布的开源模型包括1B和7B两个版本,旨在生成高质量的AI图像,且该模型仍然保持了开源、免费和可商用的特性。技术报告指出,深度学习模型在GenEval和DPG-Bench等基准测试中表现优异,尤其是在多模态理解和文本到图像的指令遵循能力方面取得了显著进展。

随着DeepSeek的崛起,其影响力不仅局限于技术领域,更蔓延至整个投资市场。英伟达的股价在DeepSeek模型发布后的交易日中大幅下跌,造成市值蒸发,影响幅度之大令人瞩目。同时,英伟达创始人黄仁勋在彭博亿万富豪榜上的位置也因此受到了挑战。这场因DeepSeek引发的波动,甚至被形象地比喻为“蓝鲸对科技股的冲击”,让许多传统科技巨头感到不安。

DeepSeek此前的模型R1一经推出便引起了巨大反响,社交媒体上甚至出现了网友将其与当前市面上的其他竞争对手进行对比的巨大梗图,显示出网友们对于DeepSeek崛起的强烈关注。业界对美国科技巨头在AI基础设施方面的重金投入也产生了质疑,DeepSeek的影响随之扩展,许多用户在社交上积极反馈了对新模型-7B的使用体验,整体反响积极。

据技术报告介绍,DeepSeek的最新多模态模型不仅是对前作Janus的升级,还在训练策略和数据扩展方面做了大量改进。在多模态理解和指令遵循性能的提高上,研究者们采用了更高效的训练方法,解耦了视觉理解与图像生成任务,以确保两个任务在功能上的最优化。

为了提升模型的表现,DeepSeek还对数据集的使用比例进行了调整,使其在视觉生成能力与多模态理解性能上取得更好的平衡。例如,7B模型在多模态理解基准MMBench中获得了79.2分,超越了目前一些最先进的统一多模态模型。该模型在文生图指令遵循基准GenEval中的得分也取得了优异成绩,进一步印证了其在市场上的强大竞争力。

尽管DeepSeek的新模型展现出了优异的性能,但仍然存在一些局限性。其输入的分辨率限制在384x384像素,对细粒度任务(如OCR文本识别)的表现可能会受影响。尽管模型生成的图像在语义内容上丰富,但因分辨率低和视觉tokenizer的重建损失,可能导致生成图像在细节上的不足。例如,图像中小面部区域的细节可能显得模糊不清。

整体而言,DeepSeek新发布的多模态模型展示出其背后深厚的技术实力和市场潜力,能够在激烈的AI竞争中脱颖而出。随着技术的快速迭代,DeepSeek的未来发展备受期待,而这场科技领域的新竞争,也将改变现有格局,推动行业向更高水平发展。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多