免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 春节前夕,国内大模型创业公司争相发布新模型,力求追赶OpenAI o1

春节前夕,国内大模型创业公司争相发布新模型,力求追赶OpenAI o1

时间:2025-01-22 17:20

小编:小世评选

春节临近,国内的大模型创业公司如同蜂拥而至,纷纷相继发布了多个对标OpenAI o1的新模型,显示出对市场竞争的高度重视与追求。1月20日,Deepseek与Kimi这两家公司便在同一天发布了各自的新模型,前后相继,显示出发布的密集程度。

在Deepseek推出了新模型DeepSeek-R1之后,仅两个小时,Kimi便紧接着发布了k1.5多模态思考模型。Kimi官方介绍称,该模型在数学、代码及多模态推理等方面都有显著提升,宣称达到了与OpenAI o1正式版相当的推理性能。这标志着Kimi成为除OpenAI外,首次推出具备如此高水平多模态推理能力的公司之一。

值得一提的是,Kimi的独特探索在于其C端场景的开发,采用了一种与Deepseek V3不同的基座模型方案,通过结合长短模型的权重,并实施强化学习,力求最大化地保留与OpenAI相近的模型能力。这一说法也得到了业内专家的认可,该算法工程师指出,Kimi的创新实践为其提升各项能力奠定了基础。

大模型的研发不仅需要资金和技术的支持,更多的是对人才的深度投入。这使得,以“AI六小龙”为代表的创业公司在面对互联网大厂时,面临更为严峻的挑战。MiniMax的创始人闫俊杰在接受采访时指出,对于创业公司而言,取舍显得尤为重要。他强调技术的迭代是核心,而不是单纯讲求用户数量。

针对2024年的形势,Kimi创始人杨植麟则将提升用户留存视为首要任务。由此Kimi在C端用户拓展方面取得了显著的成效,而Deepseek则在技术研发上逐渐成为行业的焦点。Kimi推出的k1.5模型,以及Deepseek的DeepSeek-R1,预示着AI创业公司的技术与用户双重发展成为可能。

Deepseek的DeepSeek-R1模型在其后训练阶段引入了强化学习技术,即使在少量标注数据的情况下,仍能显著提升推理能力。根据官方介绍,DeepSeek-R1在数学、代码和自然语言推理等任务上表现出色,堪比OpenAI o1。其API服务定价也颇具竞争力,标志着其在市场上的进一步渗透。

同样在1月20日,Kimi也迅速推出了全新k1.5多模态思考模型,官方表示该模型在基准测试中达到了当前最高水平的推理能力。从性能数据来看,Kimi的k1.5模型在短链思考模式下,已超越全球范围内的短思考SOTA模型,如GPT-4o和Claude 3.5 Sonnet,显示出强大的技术实力。在长链思考模式下,也达到了OpenAI o1的性能水平。

不仅是Deepseek和Kimi,市场竞争的激烈程度在1月20日的发布中得到了全面体现。字节跳动旗下的豆包发布了实时语音大模型,而阶跃星辰也推出了针对内容创作的Step-2系列语言模型,显示出这一领域日益火热的技术竞争。

在这一背景下,各大创业公司和互联网大厂之间的竞争愈发复杂,策略和方向的分歧也日益明显。李开复在响应媒体时表示,大公司具备更多的资源来“烧”超大模型,而他的零一万物则选择了更适中参数且聚焦行业模型的发展道路。这种大模型创业公司的战略调整反映了行业内彼此之间的分野与发展差异。

尽管“AI六小龙”的估值增长迅速,但业务落地、用户规模的不足,造成了一部分投资人的焦虑。业内人士指出,在技术和产品的竞争中,这些创业公司要么要明确差异化定位,要么需要充分利用时间窗口拓展自身优势。

展望2024年,在有限的资源和时间内,取舍与聚焦成为了众多大模型创业公司的战略核心。闫俊杰强调,技术迭代的优先级将在决策中占据重要位置,而Kimi则希望兼顾用户成长与技术更新的努力。

在竞争激烈的AI市场中,如何平衡技术发展与用户需求,已经成为大模型创业公司的一道重要考题。随着新模型的不断推出,如何在产品与技术两方面兼得,考验着这些初创公司的智慧与执行力。产业未来如何发展,值得期待。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多