北京智源发布全球首个多模态大模型“悟界”系列，推动AI新发展

时间：2025-07-22 18:45

小编：星品数码网

近日，北京智源人工智能研究院在其年度技术峰会上亮点频出，正式发布了“悟界”系列大模型，其中包括全球首个原生多模态世界模型“悟界・Emu3”和脑科学领域前所未有的多模态通用基础模型“悟界・见微 Brainμ”。这一系列革命性成果不仅在学术界引起广泛关注，也为人工智能的应用和发展打开了全新的视野。

多模态世界模型的辽阔愿景

让我们聚焦于“悟界・Emu3”。该模型的推出标志着人工智能技术的一次重要飞跃。它采用了全新的自回归框架，仅根据下一个token进行预测，而无需依赖传统的扩散模型或组合方法。正因如此，Emu3在文本、图像和视频三种模态的数据理解和生成方面表现出色，实现了多模态输入和输出的端到端映射。这意味着，不同类型的数据可以通过统一的模型进行理解和生成，为跨模态交互提供了强大的技术基础。

值得一提的是，Emu3的设计契合了当今社会对复杂数据分析与处理的迫切需求。随着数字化浪潮的推进，快速而准确地处理多来源、多格式的数据已成为各行各业的核心挑战。Emu3的推出，不仅提升了AI技术的适应性和普遍性，也为未来多模态数据处理的商业化应用开辟了新的可能性。

脑科学与人工智能的深度融合

北京智源发布的“悟界・见微 Brainμ”模型则开创了脑科学与人工智能相结合的新篇章。该模型基于Emu3的架构，利用fMRI、EEG、光子显微镜等技术所获取的脑信号，通过统一的token化处理实现多模态脑信号与文本、图像等模态间的多向映射。这一创新不仅在理论上探讨了神经科学的各类现象，在实践中则能支持跨任务、跨模态的统一建模，为多种神经科学下游任务提供了一站式解决方案。

通过该模型，研究人员可以在更高的层面上理解人脑的运作。同时，这一技术的应用前景十分广泛，涵盖了医学成像、临床诊断、心理学研究等多个领域，未来有望打造出更多智能化的脑-机接口产品，进一步推动智能医疗的发展。

具身智能的崭新范式

此次发布会的另一亮点是“悟界・RoboOS 2.0”，这是一种支持多种型号机器人协同工作的跨本体大小脑协作框架。这一框架不仅提升了机器人之间的协作能力，也为生态系统的智能化建设提供了新的方向。搭配具身大脑大模型“悟界・RoboBrain 2.0”和全原子微观生命模型“悟界・OpenComplex2”的应用，标志着智源在构建具身智能系统方面的进一步探索。

具身智能是指融合环境和传感器，在实际环境中执行复杂任务的技术。这一领域的进展不仅有助于改进机器人对人类指令的理解能力，也能够实现更加自然的互动与沟通。这将为机器人在医疗、农业、物流等行业的应用升级加速，同时也将未来人机交互的体验提升到全新的高度。

与展望

北京智源的“悟界”系列大模型的发布，将为未来的人工智能发展注入新的动力。通过多模态模型的结合，不同领域间的技术壁垒开始逐渐消融，实现更高效的数据交互与融合应用。同时，在脑科学和具身智能的应用创新中，AI技术也将愈加深入我们的日常生活和工作中。

在未来的发展中，智源将继续秉持创新的核心理念，推动多领域交叉融合，携手更多科研机构、企业及研究者，共同探索人工智能的无限可能。我们期待，随着这些前沿技术的不断成熟与推广，人工智能将在各个方面实现更深层次的应用，为人类社会的发展和进步带来颠覆性的变化。

北京智源发布全球首个多模态大模型“悟界”系列，推动AI新发展

精品推荐

相关文章