[新闻] 创新数据收集工具助机器人学习能力升级| 数博会官网

创新数据收集工具助机器人学习能力升级

作者: 吴双    来源: 人民邮电报   编辑: 杨小婷  时间:2024-11-07 16:51:04  

  在人工智能(AI)领域,让机器人在从未见过的环境中执行任务是长期以来面临的重要挑战。传统上,研究人员需要为每个新环境重新训练机器人,这不仅耗时费力,而且成本高昂。然而,近期的一项突破性研究有望改变这一局面。

  纽约大学、Meta和机器人公司HelloRobot的研究人员携手合作,成功开发了一系列人工智能模型,这些模型能够教导机器人在无需进一步训练或微调的情况下,在新环境中顺利完成基本任务。这些被称为机器人实用模型(RobotUtilityModels,简称RUMs)的AI模型,已经成功帮助机器人在陌生环境中以高达90%的成功率完成了五项不同的任务,包括开门、拉开抽屉、捡起纸巾、提起袋子以及抓取圆柱形物体。

  这项研究的初衷在于简化并加速机器人新技能的教授流程,同时使它们能够在更多未知的领域中发挥作用。纽约大学的博士生MahiShafiullah表示:“过去,我们更多地关注于如何让机器人做所有事情,而没有真正思考如何让机器人在任何地方都能做它们已经知道如何做的事情。我们的研究正是为了解决这个问题,即如何教机器人在任何地方都能打开任何门。”

  教授机器人新技能通常需要大量的数据支持,而这些数据的获取却十分困难。因为机器人训练数据需要通过物理方式收集,这不仅耗时,而且成本高昂。与可以从互联网上轻松获取数据的大语言模型等AI相比,构建和扩展机器人训练数据库的难度要大得多。

  为了应对这一挑战,研究人员开发了一种创新的数据收集工具:将一个iPhone附着在一个廉价的夹取器上,这种夹取器通常用于捡拾垃圾。研究团队利用这种设置在40个不同的环境中(包括纽约市和泽西市的家庭)记录了大约1000次演示,涵盖了五项任务中的每一项。随后,他们利用这些演示数据训练了五个数据集上的学习算法,从而创建了五个RUM模型。

  这些RUM模型被部署在Stretch机器人上进行测试。Stretch机器人由一个轮式单元、一个高杆和一个可伸缩的手臂组成,手臂上装有一个iPhone用于拍摄视频。测试结果表明,这些模型在新环境中执行任务的成功率高达74.4%。为了进一步验证任务是否成功完成,研究人员将iPhone和机器人头部安装的摄像头拍摄的图像输入OpenAI最新的GPT-4o大语言模型(LLM)。如果GPT-4o回答“否”,则重置机器人并再次尝试。

  研究人员MohitShridhar指出,机器人领域专家面临的一个重大挑战是实验室环境与现实世界的差异。因此,任何有助于机器人在新设置中更可靠地执行任务的研究都备受瞩目。Shafiullah表示:“我们的目标是实现一种机制,即我可以训练一些东西,将其上传到互联网,然后有需要的人可以在家中的机器人上下载并运行它。”

  这项研究不仅为构建其他实用的机器人模型提供了一个通用的框架,而且有望简化机器人新技能的教授过程,为人工智能和机器人技术的发展带来了创新的解决方案。