免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 字节跳动推出全新多模态AI模型OmniHuman 助力数字人技术进步

字节跳动推出全新多模态AI模型OmniHuman 助力数字人技术进步

时间:2025-02-07 06:20

小编:小世评选

近日,字节跳动的研究团队推出了全新端到端多模态人工智能数字人模型——OmniHuman。该模型的研发标志着数字人技术的又一次飞跃,能够将单一照片转化为逼真的动态视频,展现人物讲话、歌唱及自然动作,极大增强了数字化内容的丰富性和真实感。

近年来,字节跳动在人工智能领域的布局持续加速。在2024年12月的火山引擎Force大会上,火山引擎的总裁谭待透露,字节跳动的豆包通用模型自发布以来的日均tokens使用量已经从初期的约1200亿增长至超过4万亿,增长幅度达到33倍。这一数据不仅反映了字节跳动在大模型技术持续进步的步伐,也预示着其在数字人和多模态AI领域的广泛应用潜力。

字节跳动在本次大会上还正式推出了多个新模型,包括豆包视觉理解模型、豆包3D生成模型及全面升级的豆包通用模型pro等。这些不断升级的AI模型为用户提供了更强大的数字创作能力,并促进了个性化内容的生成。

根据浙商证券的分析,字节跳动在2024年的资本支出预计达到800亿元,接近国内其他科技巨头如百度、阿里巴巴和腾讯三家的总和。而在2025年,其资本支出有望进一步攀升至1600亿元,这一加大投入的举措显示了字节跳动在端侧AI和AI应用上的重要战略方向。

随着技术的不断迭代,字节跳动的创新成果已在多家A股上市公司中显露端倪。例如,中广天择与字节跳动合作出品的内容品牌《儿科医生》已成功播出三季,并在内容生产中应用了一些AI技术,不断推进音视频数据在大模型建设上的深入合作。引力传媒也与字节跳动保持着密切合作,基于自身的电商营销行业模型,推出了多款AIGC产品应用,展现出AI技术的实际应用前景。

与字节跳动一同推动数字人的公司还有奥士康,其深耕服务器领域多年,为字节跳动等多家科技巨头客户提供服务。字节跳动旗下的AI产品在服务器需求及算法部署上,都为奥士康打开了新的市场机遇。

业内关于人形机器人领域的研究也进入了快速发展阶段。英伟达近期展示的一款人形机器人凭借其模仿C罗、詹姆斯和科比的能力引发广泛关注。该机器人通过名为ASAP的模型训练,成功缩小了仿真与现实之间的差距,使得机器人能够完成流畅自然的全身动作。这一进展为人形机器人产业注入了新的活力,为未来数字人与人形机器人的联动提供了可能。

据《人形机器人产业研究报告》的数据显示,2024年中国人形机器人市场规模将达到27.6亿元,预计到2029年这一市场规模将扩大至750亿元,并在2035年达到3000亿元的规模。这一迅猛增长足以看出,随着科技巨头纷纷布局,人形机器人行业正迎来一波新高潮。

在A股上市公司中,汉威科技与多家人形机器人制造商进行了合作,并向部分机器人厂家小批量供货,显示出其在这一行业的前瞻布局。步科股份则针对协作型人形机器人推出了第三代无框力矩电机产品。在技术不断革新的背景下,汇川技术也在持续深入研究人形机器人领域,正处于早期洞察和预研阶段,开发包括电机、驱动和执行器模组等零部件产品。

字节跳动的OmniHuman多模态AI模型的发布不仅在数字人技术方面引领了一波新的创新浪潮,也为其在广阔的AI市场开辟了更多的发展机会。随着多个相关行业逐步融合,数字人和人形机器人的应用场景日益丰富,相关技术也将不断推陈出新,为各行各业提供更加多元化的解决方案。随着投资的持续增加和技术的不断完善,字节跳动及其合作伙伴们将在未来的数字化浪潮中扮演重要角色。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多