单眼SLAM导航研究

(整期优先)网络出版时间:2017-12-22
/ 2

单眼SLAM导航研究

王均

(南京南瑞集团公司信息系统集成分公司211106)

摘要:SLAM技术相关问题是考虑自主机器人在未知环境,没有人协助部署和操作时的导航需要。最基本的一种导航技术是由人勘查环境、机器人平台制作地图。其他更复杂的方案,比如在RFID的协调下,多人和多机器人的轨迹制图,还有方案则使用SLAM帮助机器人认识环境,提高设备的可用性。

在此我们探讨人际交互(HRI)单眼SLAM问题,借助传感器技术,和不同的SLAM技术。

关键词:SLAM,导航,自主机器人,人机交互

一、SLAM概述

SLAM使用的传感器遵循几个标准,从理论上讲,最有意义的分类是本体感和外部感。本体感传感器测量机器人系统内部的数值,如关节的姿势、剩余电量、内部温度等。至于外部感,测量的是环境数据,通常是传感器本身的响应。

测距仪是一种外部传感器,测量它们和环境中某点的距离,使用主动方式测量距离,发送声音、光、无线电波,监听回波,就是声纳、激光测距仪和雷达。这些设备在机器人身上做扫描,同时或在极短的时间间隔内执行一组测量。扫描完成后,每个子测量与承载数据对比,得到其中的关联。

激光测距仪有不同的工作原理,飞行时间测量、光干涉、或相移方法。由于激光比其他种类波的聚焦性能更好,激光测距的精度也最高。

普通单眼EKF-SLAM程序基于检测可区别的兴趣点,将它们引入滤波器建立的地图,通过帧序列跟踪它们,估计它们的姿态和传感器测距。对每个地标周围的图像块,概括出它的“外形”,存储下来用于识别,地标本身通常用统一逆深度参数化建模。

预测过程基于概率过滤,对机器人移动和传感器位置预测,即使在单眼SLAM算法中,也可以利用任何传感器数据。数据缺乏时,移动预测符合高斯分布。这样使用一个定速移动模型,加上角度脉冲和线性加速模型作为白噪声。地图预测就相当简单:地标或地图兴趣点作为环境的一部分,假设它们的位置和姿态不会变化。

预测完成后,常规的EKF-SLAM将预测和传感器数据进行比较产生直接观察模型。这一步需要解决数据关联问题,将预测与传感器真实测量匹配,计算提取每帧中所有可能的兴趣点和预测点做匹配,处理基于随机移动预测的不确定性,用主动搜索战略应对这个问题。使用直接观察模型的像素空间预测的地图特征,对每一个像素搜索相似的点(根据存储的块),这是ZNCC(零平均归一化交叉相关)算法。理想情况下,每个预测特征会匹配同一个特征在下一帧中的像素。这个过程失效的因素有:视觉传感器、环境的几何形状、活动主体的存在,以及别的一些因素。所以这些匹配点要经过数据关联验证算法检测。

一旦在像素坐标中发现地标预测和图像空间的关联配对,就可以使用普通EKF算法进行计算。

虽然用EKF对地图迭代估算很直接,还是存在着给定单眼SLAM很多特征定义的关键过程。SLAM基于空间分布、图像中的位置,当使用常规点检测,图像中会有几十甚至几百个点的频度,大多数会被SLAM忽略。不过即时方式中没有深度信息也还是可以的。因此,这种情况有两个策略:无延迟方式试着“猜测”深度初始值,延迟方式在一段时间内追踪一个特征,直到得到理想的深度估算,此时才进行初始化处理。

这两种策略定义了很多SLAM过程特征。无延迟方式看到地标试着用使用特征点,这些点快速引入过滤器,晚些才能验证,或者叫被拒绝数据关联验证了。另一方面,延迟方式对那些点使用之前先跟踪和估算,因此使用的地标通常更稳定可信。

延迟逆深度(DI-D)单眼SLAM属于延迟特征初始化技术,地标第一次被观察到与允许估算视差初始化之间的延迟,实现测距估算,通过三角法测算出地标的深度。

二、实验和结果

引入单眼传感器可以提供非恒定双路信息,证明是有用的,前文讨论过DI-D的一个弱点是需要通过合成特性初始化标尺,而标尺会移动。这样系统需要更多自治,利用隐含的强制实施的人造地标的人机界面。此外,因为并不限于人造地标,度量标准初始化会引入更多特性,这会平滑减少漂移。

上图显示两种取样跟踪,橙色线条和蓝色线条显示有和没有非恒定DI-D特征初始化方法的结果。左边是一个院子,有一些座椅和树,轨迹19米,两个90度转弯,属于有丰富地标的半结构化环境。右面是10米长的直线死胡同,两边是均质纹理表面的墙,没什么显著标记。对单眼SLAM这两种场景都有足够多的不利因素:单个移动传感器的时差不能发现视场中心区域、快速的定向和转向速度、表面/环境没有强烈的视觉特征、自然光照和阴影,等等。

引入伪双通道特征初始化可以马上实现距离估算,不会因等等数据处理造成延迟。对每种情况都非常有效,例如,借助不确定预测模型和特征选择程序,序列间甚至同一个信号序列SLAM中启发式算法的使用。当延迟方法用于特征初始化,不需要花费计算能力用于估测地标,也不需要引入EKF地图。

三、结论

适当的方法使系统具备更多弹性,特别是在场景快速变化比如转动的时候,上图中,延迟单眼SLAM因为环境变化,只有很少时间用于特征初始化,特征初始化的次数减少,导致估算精度降低,最后,累积误差大到不能修正,EKF无法收敛,估算结果不能使用。左图显示了传统延迟SLAM算法如何发生明显的降级,此外,右图显示因为视差减少,单眼模式测距仪工作非常困难。这种现象,由于EKF对不确定快速变化的无能为力,不仅受行进距离影响,也在方向判断上产生妥协。

真实数据测试中,DI-D的主要弱点是需要校正处理,而校正处理依赖本地可靠技术处理,得益于通用地图扩展和循环近似技术已不存在。传感器之间位置估算模型有固定的不确定性,很难减少模型的运动积累,即使有基于视差的方案,不确定测量还是低于纯单眼测量。

参考文献:

【1】Durrant-WhyteH,BaileyT.Simultaneouslocalizationandmapping:partI.IEEERobotAutomMag.2006;13(2):99–110.

【2】DiosiA,TaylorG,KleemanL.InteractiveSLAMusinglaserandadvancedsonar.In:RoboticsandAutomation,ICRA2005ProceedingsoftheIEEEInternationalConference.