DeepTech深科技@伯克利团队提出一种更“聪明”的机器人导航系统,无需任何模拟或人工监督

移动机器人导航通常被认为是一个几何问题 , 机器人的目标是感知环境中障碍物的几何形状 , 以规划出走向指定位置的无碰撞路径 。
目前 , 从室内导航到自动驾驶 , 自主导航的主要方法是让机器人构建地图 , 将自己定位在地图中 , 并使用地图来计划和执行使机器人到达目标的动作 , 这种同时定位、地图绘制(SLAM)和规划路径方法已取得了令人印象深刻的结果 , 并且是当前最先进的自主导航技术的基础 。
但是 , 这种方法仍然存在局限性 , 例如在无纹理场景中的性能下降 。 要保证机器人在环境中的导航行为变得越来越好 , 需要依靠更多、更昂贵的传感器 , 且在开放环境中 , 移动机器人自主导航还会面临更多挑战 , 有时候很难用纯粹的几何分析来解决 。
DeepTech深科技@伯克利团队提出一种更“聪明”的机器人导航系统,无需任何模拟或人工监督
文章图片
图|越野环境和城镇环境(来源:Berkeley)
比如 , 要步行到达一个目的地需要穿过一片茂盛的草丛 , 对人类来讲直接走过去就好 , 而当人们推着一辆小车时 , 则更青睐选择在相对平坦的路面上走 。 这些看似无需思考就能做出的判断 , 对当今的自主导航移动机器人来说却十分困难 , 很可能决策失败:它们会认为高高的草丛是与混凝土墙相同的障碍 , 而且不了解选择平滑的路面和颠簸路面之间的区别 。
因为大多数移动机器人纯粹是根据几何学来思考的 , 从语义理解的角度出发 , 使用人类提供的可穿越性或路面标签上训练出来的计算机视觉方法来实现 , 但是 , 可遍历性、颠簸性等和移动性相关的属性是自然环境的物理特征 , 机器人是否能直接从图像中推断出自主导航能力?并像人一样选择最合适的路径规划到达目标?
来自加州大学伯克利分校的AI研究人员开发了一种方案 , 这是一种完全自主 , 可自我改进的基于端到端学习的移动机器人导航系统 , 移动机器人可通过自身在现实世界中的经验来自主学习环境的物理属性 , 而无需任何模拟或人工监督 , 团队将这个机器人学习系统称为BADGR:伯克利自动驾驶地面机器人 。
DeepTech深科技@伯克利团队提出一种更“聪明”的机器人导航系统,无需任何模拟或人工监督
文章图片
图|ClearpathJackal移动机器人平台(来源:Berkeley)
先来看下硬件配置 。 研究人员使用了一台ClearpathJackal移动机器人做测试平台 , 这个机器人的尺寸为508毫米×430毫米×250毫米 , 重17千克 , 非常适合在城市和越野环境中行驶 , 默认的传感器套件包括一个六自由度的IMU(用于测量线性加速度和角速度) , 一个用于近似全局位置估计的GPS单元以及用于测量车轮速度的编码器 。 研究人员还在机器人的顶部添加了新的传感器:两个向前的170度视场640×480像素摄像机、一个2D激光雷达和一个指南针 。
机器人内部配备了NVIDIAJetsonTX2计算机 , 这是一个运行深度学习应用程序的理想选择 。 数据被保存到一个外部SSD , 该SSD足够大也足够快 , 能存储每分钟1.3GB的传感器数据流 。 团队通过安装在机器人顶部的4G智能手机远程监控实验、视频流以及必要时的远程操作 。
接下来的工作重点分为四个步骤:1、自主收集数据;2、通过自我监督自动标记数据;3、训练基于图像的神经网络预测模型;4、使用预测模型来进行规划 , 并执行能让机器人完成导航任务的动作 。
图|BADGR实时进行自主规划与导航(来源:Berkeley)
研究人员设计了数据收集方法 , 能够以最少的人工干预收集大量多样的数据进行训练 。 由于使用现实世界的机器人系统收集数据的成本很高 , 团队选择使用非策略学习算法 , 以便能够使用任何控制策略收集数据 , 并对所有数据进行训练 。
此外 , 设计数据收集策略时的第二个考虑因素是确保充分探索环境 , 同时还要确保机器人执行在测试时实际希望执行的动作序列 。 单纯的统一随机控制策略是不够的 , 因为由于机器人的线性和角速度作用界面 , 机器人将主要驱动直线行驶 , 这将导致探索不足和不切实际的测试时间动作序列 。 因此 , 团队使用时间相关的随机游走控制策略来收集数据 。


推荐阅读