单眼SLAM导航研究-中国期刊网

首页 > 《电力设备》 > 2017年23期 > 单眼SLAM导航研究

（整期优先）网络出版时间：2017-12-22

作者: 王均

电气工程 >电力系统及自动化

打印

同系列资源

/ 2

单眼SLAM导航研究

王均

（南京南瑞集团公司信息系统集成分公司211106）

摘要：SLAM技术相关问题是考虑自主机器人在未知环境，没有人协助部署和操作时的导航需要。最基本的一种导航技术是由人勘查环境、机器人平台制作地图。其他更复杂的方案，比如在RFID的协调下，多人和多机器人的轨迹制图，还有方案则使用SLAM帮助机器人认识环境，提高设备的可用性。

在此我们探讨人际交互（HRI）单眼SLAM问题，借助传感器技术，和不同的SLAM技术。

关键词：SLAM，导航，自主机器人，人机交互

一、SLAM概述

SLAM使用的传感器遵循几个标准，从理论上讲，最有意义的分类是本体感和外部感。本体感传感器测量机器人系统内部的数值，如关节的姿势、剩余电量、内部温度等。至于外部感，测量的是环境数据，通常是传感器本身的响应。

测距仪是一种外部传感器，测量它们和环境中某点的距离，使用主动方式测量距离，发送声音、光、无线电波，监听回波，就是声纳、激光测距仪和雷达。这些设备在机器人身上做扫描，同时或在极短的时间间隔内执行一组测量。扫描完成后，每个子测量与承载数据对比，得到其中的关联。

激光测距仪有不同的工作原理，飞行时间测量、光干涉、或相移方法。由于激光比其他种类波的聚焦性能更好，激光测距的精度也最高。

普通单眼EKF-SLAM程序基于检测可区别的兴趣点，将它们引入滤波器建立的地图，通过帧序列跟踪它们，估计它们的姿态和传感器测距。对每个地标周围的图像块，概括出它的“外形”，存储下来用于识别，地标本身通常用统一逆深度参数化建模。

预测过程基于概率过滤，对机器人移动和传感器位置预测，即使在单眼SLAM算法中，也可以利用任何传感器数据。数据缺乏时，移动预测符合高斯分布。这样使用一个定速移动模型，加上角度脉冲和线性加速模型作为白噪声。地图预测就相当简单：地标或地图兴趣点作为环境的一部分，假设它们的位置和姿态不会变化。

预测完成后，常规的EKF-SLAM将预测和传感器数据进行比较产生直接观察模型。这一步需要解决数据关联问题，将预测与传感器真实测量匹配，计算提取每帧中所有可能的兴趣点和预测点做匹配，处理基于随机移动预测的不确定性，用主动搜索战略应对这个问题。使用直接观察模型的像素空间预测的地图特征，对每一个像素搜索相似的点（根据存储的块），这是ZNCC（零平均归一化交叉相关）算法。理想情况下，每个预测特征会匹配同一个特征在下一帧中的像素。这个过程失效的因素有：视觉传感器、环境的几何形状、活动主体的存在，以及别的一些因素。所以这些匹配点要经过数据关联验证算法检测。

一旦在像素坐标中发现地标预测和图像空间的关联配对，就可以使用普通EKF算法进行计算。

虽然用EKF对地图迭代估算很直接，还是存在着给定单眼SLAM很多特征定义的关键过程。SLAM基于空间分布、图像中的位置，当使用常规点检测，图像中会有几十甚至几百个点的频度，大多数会被SLAM忽略。不过即时方式中没有深度信息也还是可以的。因此，这种情况有两个策略：无延迟方式试着“猜测”深度初始值，延迟方式在一段时间内追踪一个特征，直到得到理想的深度估算，此时才进行初始化处理。

这两种策略定义了很多SLAM过程特征。无延迟方式看到地标试着用使用特征点，这些点快速引入过滤器，晚些才能验证，或者叫被拒绝数据关联验证了。另一方面，延迟方式对那些点使用之前先跟踪和估算，因此使用的地标通常更稳定可信。

延迟逆深度（DI-D）单眼SLAM属于延迟特征初始化技术，地标第一次被观察到与允许估算视差初始化之间的延迟，实现测距估算，通过三角法测算出地标的深度。

二、实验和结果

引入单眼传感器可以提供非恒定双路信息，证明是有用的，前文讨论过DI-D的一个弱点是需要通过合成特性初始化标尺，而标尺会移动。这样系统需要更多自治，利用隐含的强制实施的人造地标的人机界面。此外，因为并不限于人造地标，度量标准初始化会引入更多特性，这会平滑减少漂移。

上图显示两种取样跟踪，橙色线条和蓝色线条显示有和没有非恒定DI-D特征初始化方法的结果。左边是一个院子，有一些座椅和树，轨迹19米，两个90度转弯，属于有丰富地标的半结构化环境。右面是10米长的直线死胡同，两边是均质纹理表面的墙，没什么显著标记。对单眼SLAM这两种场景都有足够多的不利因素：单个移动传感器的时差不能发现视场中心区域、快速的定向和转向速度、表面/环境没有强烈的视觉特征、自然光照和阴影，等等。

引入伪双通道特征初始化可以马上实现距离估算，不会因等等数据处理造成延迟。对每种情况都非常有效，例如，借助不确定预测模型和特征选择程序，序列间甚至同一个信号序列SLAM中启发式算法的使用。当延迟方法用于特征初始化，不需要花费计算能力用于估测地标，也不需要引入EKF地图。

三、结论

适当的方法使系统具备更多弹性，特别是在场景快速变化比如转动的时候，上图中，延迟单眼SLAM因为环境变化，只有很少时间用于特征初始化，特征初始化的次数减少，导致估算精度降低，最后，累积误差大到不能修正，EKF无法收敛，估算结果不能使用。左图显示了传统延迟SLAM算法如何发生明显的降级，此外，右图显示因为视差减少，单眼模式测距仪工作非常困难。这种现象，由于EKF对不确定快速变化的无能为力，不仅受行进距离影响，也在方向判断上产生妥协。

真实数据测试中，DI-D的主要弱点是需要校正处理，而校正处理依赖本地可靠技术处理，得益于通用地图扩展和循环近似技术已不存在。传感器之间位置估算模型有固定的不确定性，很难减少模型的运动积累，即使有基于视差的方案，不确定测量还是低于纯单眼测量。

参考文献：

【1】Durrant-WhyteH，BaileyT.Simultaneouslocalizationandmapping：partI.IEEERobotAutomMag.2006；13（2）：99–110.

【2】DiosiA，TaylorG，KleemanL.InteractiveSLAMusinglaserandadvancedsonar.In：RoboticsandAutomation，ICRA2005ProceedingsoftheIEEEInternationalConference.

同系列内容