视觉SLAM综述

SIGAI_csdn

于 2019-01-02 13:55:09 发布

阅读量4k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习人工智能 AI 文章标签：人工智能

本文链接：https://blog.csdn.net/SIGAI_CSDN/article/details/85612582

视觉SLAM（Simultaneous Localization And Mapping）是机器人领域的核心技术，它结合传感器数据实现实时环境建图与自身定位。经典vSLAM系统通常包含视觉里程计、后端优化、闭环检测和建图四个部分。本文详细介绍了间接法和直接法两种SLAM方法，包括MonoSLAM、ORB-SLAM、DTAM等典型系统，并探讨了基于深度学习的SLAM进展，如UnDeepVO和CNN-SLAM等。未来视觉SLAM将朝着主动SLAM、语义SLAM和多传感器融合方向发展。

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》，清华大学出版社，雷明著，由SIGAI公众号作者倾力打造。

什么是视觉SLAM

SLAM是“Simultaneous Localization And Mapping”的缩写，可译为同步定位与建图。概率 SLAM 问题 (the probabilistic SLAM problem) 起源于 1986 年的IEEE Robotics and Automation Conference 大会上，研究人员希望能将估计理论方法 (estimation-theoretic methods) 应用在构图和定位问题中。 SLAM最早被被应用在机器人领域，其目标是在没有任何先验知识的情况下，根据传感器数据实时构建周围环境地图，同时根据这个地图推测自身的定位[1]。

假设机器人携带传感器 (相机) 在未知环境中运动，为方便起见，把一段连续时间的运动变成离散时刻 t=1，…k，而在这些时刻，用 x 表示机器人的自身位置，则各时刻的位置就记为 x1，x2…xk，它构成了机器人的轨迹。地图方面，假设地图由许多个路标组成，而每个时刻，传感器会测量到一部分路标点，得到它们的观测数据。设路标点共有 N 个，用 y1，y2…yn 表示。通过运动测量 u 和传感器读数 z 来求解定位问题 (估计 x)和建图问题 (估计 y)。