谷歌DeepMind发布新型AI模型Gemini Robotics,助力机器人完成复杂任务
时间:2025-03-13 17:40
小编:小世评选
2023年3月12日,北京时间今晚,谷歌DeepMind正式推出了两款新型AI模型,其中一款名为Gemini Robotics,这一创新产品旨在帮助机器人更高效地完成现实世界中的复杂任务。Gemini Robotics以其先进的视觉语言行动模型为基础,可以在无需专门训练的情况下,快速理解并适应新的环境和情境,标志着机器人技术的又一次重大进步。
Gemini Robotics的灵感来源于谷歌的最新AI旗舰模型——Gemini 2.0。根据谷歌DeepMind机器人部门高级总监Carolina Parada的介绍,Gemini Robotics通过整合多模态的世界理解能力,并引入物理行为的新模态,从而增强了机器人在实际应用中的表现。该模型在通用性、互动性和灵活性三个核心领域取得了显著的进展,使得机器人不仅能够应对未知的情境,还能更加有效地与人类及周围环境进行互动。
Gemini Robotics特别擅长精确的物理操作,这包括诸如折纸、打开瓶盖等复杂的动作,体现了其在为机器人赋能方面的强大能力。另一款名为Gemini Robotics-ER的模型,专注于具象推理,这种先进的视觉语言模型可以帮助机器人理解复杂且动态的世界。
Parada进一步指出,Gemini Robotics-ER的设计旨在应对特定的推理任务。例如,机器人在装便当盒时,必须考虑到桌上物品的摆放和操作方式,这种复杂的思维与决策能力在过去的机器人技术中很难实现。通过将Gemini Robotics-ER与现有的低级控制系统对接,机器人专家可以开启新的功能,从而实现更高层次的自动化与智能化。
在安全性方面,谷歌DeepMind的研究人员Vikas Sindhwani提到,团队正在开发一种“分层安全策略”,以确保机器人在特定情况下的行为不会引发意外。在这一过程中,Gemini Robotics-ER不仅使机器人具备判断行为安全性的能力,还为AI领域的安全研究提供了新的基准和框架。据了解,去年,谷歌DeepMind曾推出过“机器人宪法”,这是一套受到科幻作家艾萨克·阿西莫夫启发的机器人行为规范,旨在为未来的机器人行为提供伦理指导。
据外媒The Verge报道,谷歌DeepMind于此次新产品研发中,与Apptronik达成合作,共同致力于“打造下一代人形机器人”。这一合作有望加速Gemini Robotics与实际应用的结合,使得先进的AI模型能够在更广泛的场景中发挥作用。谷歌也向包括Agile Robots、Agility Robotics、波士顿动力和Enchanted Tools等在内的“受信任的测试者”开放了Gemini Robotics-ER模型,进一步推动了合作与应用的进程。
随着Gemini Robotics的推出,谷歌DeepMind展示了其在机器人技术领域的最新成就,强调了在智能机器人发展中的重要性。Parada表示:“我们专注于打造能够理解物理世界并在其中行动的智能,我们非常期待将这一技术应用于多个领域和多种表现形式。”这一展望不仅让人们对未来的机器人技术充满期待,也为AI的发展提供了新的可能性。
在实际应用层面,Gemini Robotics有望赋能各行业的智能化转型,例如在医疗、物流、制造等领域。机器人将不仅限于传统的自动化操作,通过更高层次的理解和互动能力,机器人将能够承担更复杂的任务,极大提升工作效率与准确性。
而言,谷歌DeepMind推出的Gemini Robotics代表了机器人技术的一个新高度,以其卓越的性能和灵活的应用前景,开启了机器人智能新纪元。随着这一技术的不断发展与普及,期待未来的机器人能够更好地融入我们的生活,提升我们的工作与生活质量。