MIT引入了一种革命性的机器人训练方法,采用了受大型语言模型(如GPT-4)成功启发的策略。这种新模型涉及全面的数据积累策略,机器人不仅仅在特定的、针对性的任务上进行训练,而是在广泛、多样的数据集上进行训练,以增强它们的适应性和解决问题的能力。
关键要点:
- MIT的新训练模型受到大型语言模型的启发。
- 异构预训练变换器(HPT)框架增强了机器人适应性。
- 机器人可以在多样化的数据集上进行训练,改善其解决问题的能力。
- 该技术旨在使机器人能够在没有 extensive 现场培训的情况下执行任务。
这种名为异构预训练变换器(HPT)的方式是为了克服标准模仿学习的局限性,后者常常在面对轻微的环境变化或意外障碍时表现不佳。传统模型在有限数据集上训练,难以适应变化,因为它们缺乏应对多样性的深度数据。相比之下,HPT使用一种专为整合来自不同传感器和环境的信息而设计的架构,从而为机器人创造一个丰富、多样的学习环境。
研究的主要作者Lirui Wang解释道,虽然在语言模型中数据相对均匀(句子),但机器人涉及到的是一个更加异构的数据集,包括视觉输入、来自不同环境的传感器数据以及各种任务相关的信息。为了处理这种复杂性,HPT框架利用变换器(一种在自然语言处理方面表现出色的神经网络架构)将这些多样的数据结合在一起。
变换器模型的规模至关重要;模型越大,学习的细致性和有效性就越强。这种方法使得机器人能够在广泛的场景上进行初步训练,从而具备更强大的技能集,随后可以针对特定任务进行微调。用户可以指定机器人的设计、操作环境和任务,使得训练过程高度适应。
卡内基梅隆大学的副教授David Held表达了对这一技术的雄心勃勃的愿景:设想一个未来,机器人可以预装一个“通用机器人大脑”,无需 extensive 现场培训即可执行任务。这一愿景强调了HPT的变革潜力,暗示未来的机器人在执行物理任务方面可以与AI模型在生成文本时的灵活性和适应性相提并论。
这项研究部分由丰田研究院(TRI)资助,反映了机器人领域利用AI实现更自主和灵活的操作的更广泛趋势。TRI在过夜机器人训练方面的先前工作,加上与波士顿动力公司的最新合作,突显了行业向将复杂AI学习与先进机器人硬件集成的方向发展,这可能会彻底改变机器人在各个行业的开发和部署方式。