SLAM中的加权最小二乘法

滴滴哒哒答答

已于 2025-02-20 21:12:07 修改

阅读量1.2k

点赞数 26

CC 4.0 BY-SA版权

分类专栏： SLAM 文章标签：最小二乘法机器学习 python

于 2024-10-14 19:34:21 首次发布

本文链接：https://blog.csdn.net/m0_49384824/article/details/142921545

SLAM 专栏收录该内容

3 篇文章

订阅专栏

一、数学描述

机器人携带传感器在环境中运动可由 运动方程 和 观测方程 描述。

$\begin{cases}\boldsymbol{x}_k=f\left(\boldsymbol{x}_{k-1},\boldsymbol{u}_k,\boldsymbol{w}_k\right),&k=1,\cdots,K\\\boldsymbol{z}_{k,j}=h\left(\boldsymbol{y}_j,\boldsymbol{x}_k,\boldsymbol{v}_{k,j}\right),&(k,j)\in\mathcal{O}\end{cases}.$

其中 $k$ 表示时刻； $x_{^{k}}$ 表示 $k$ 时刻的位姿； $u_{k}$ 是运动传感器的读数或者输入； $y_{j}$ 为路标点； $z_{k,j}$ 表示观测数据。

$\boldsymbol{w}_k\sim\mathcal{N}\left(\boldsymbol{0},\boldsymbol{R}_k\right),\boldsymbol{v}_k\sim\mathcal{N}\left(\boldsymbol{0},\boldsymbol{Q}_{k,j}\right).$

$w_{k}$ 为运动噪声，例如对机器人下达了前进 1m 的指令，机器人实际前进了 0.9m。

$v_{k}$ 为观测噪声 ，例如前方障碍物距离机器人 1m，但传感器测量得到的值为 1.1m。

这两种噪声和卡尔曼滤波中的噪声一样，参考一文详解卡尔曼滤波两处噪声的来源及影响和过程噪声和测量噪声。

其中 $\text{N}$ 表示高斯分布， $0$ 表示零均值， $R_k,Q_{k,j}$ 为协方差矩阵。在这些噪声的影响下，我们希望通过带噪声的数据 $z$ 和 $u$ 推断位姿 $x$ 和地图 $y$ （以及它们的概率分布），这构成了一个状态估计问题。

运动方程和观测方程可以表述为：

$\begin{cases}\boldsymbol{x}_k=f\left(\boldsymbol{x}_{k-1},\boldsymbol{u}_k\right)+\boldsymbol{w}_k\\\boldsymbol{z}_{k,j}=h\left(\boldsymbol{y}_j,\boldsymbol{x}_k\right)+\boldsymbol{v}_{k,j}\end{cases}.$

其中 运动误差 和 观测误差 可表述为：

$\begin{gathered} e_{\boldsymbol{u},k} =\boldsymbol{x}_k-f\left(\boldsymbol{x}_{k-1},\boldsymbol{u}_k\right) \\ e_{\boldsymbol{z},j,k} =\boldsymbol{z}_{k,j}-h\left(\boldsymbol{x}_k,\boldsymbol{y}_j\right), \end{gathered}$

构造加权最小二乘问题为：

$\min J(\boldsymbol{x},\boldsymbol{y})=\sum_k\boldsymbol{e}_{\boldsymbol{u},k}^\mathrm{T}\boldsymbol{R}_k^{-1}\boldsymbol{e}_{\boldsymbol{u},k}+\sum_k\sum_j\boldsymbol{e}_{\boldsymbol{z},k,j}^\mathrm{T}\boldsymbol{Q}_{k,j}^{-1}\boldsymbol{e}_{\boldsymbol{z},k,j}.$

其中协方差矩阵之逆 $R_{k}^{-1}$ 和 $Q_{k,j}^{-1}$ 提供了最小二乘问题的权重分布。

二、协方差矩阵之逆提供了最小二乘问题的权重分布

1. 协方差的定义

首先，协方差是衡量两个随机变量之间关系的统计量。对于两个变量 $X$ 和 $Y$ ，它的协方差定义为：

$\mathrm{Cov}(X,Y)=E[(X-E[X])(Y-E[Y])]$

如果 $\operatorname{Cov}(X,Y)>0$ ，意味着 X 和 Y 趋向于同时增大或减小（正相关）。
如果 $\operatorname{Cov}(X,Y)<0$ ，意味着 X 增大时 Y 倾向于减小（负相关）。
如果 $\operatorname{Cov}(X,Y)=0$ ，则 X 和 Y 之间没有线性相关性。
$\operatorname{Cov}(X,Y)$ 的绝对值越大，表示两个变量的同向（正相关）或反向（负相关）关系越强。

2. 协方差矩阵

协方差矩阵 Σ 是一个对称矩阵，用于描述多维随机变量的协方差结构。设一个 n 维随机变量 X=[X1,X2,...,Xn]，其协方差矩阵定义为：

$\Sigma=\begin{bmatrix}\mathrm{Var}(X_1)&\mathrm{Cov}(X_1,X_2)&\dots&\mathrm{Cov}(X_1,X_n)\\\mathrm{Cov}(X_2,X_1)&\mathrm{Var}(X_2)&\dots&\mathrm{Cov}(X_2,X_n)\\\vdots&\vdots&\ddots&\vdots\\\mathrm{Cov}(X_n,X_1)&\mathrm{Cov}(X_n,X_2)&\dots&\mathrm{Var}(X_n)\end{bmatrix}$

对角线上元素是各观测误差的方差 Var(Xi)。
非对角线元素是不同观测值误差之间的协方差 Cov(Xi,Xj)，反映了不同观测值误差之间的相关性。

3. 最小二乘法与加权最小二乘法

在经典的最小二乘法中，我们试图通过最小化目标函数来找到一组最优参数：

$\min_\theta\sum_{i=1}^n\left(y_i-f(x_i,\theta)\right)^2$

假设观测数据 yi 存在观测误差（观测噪声）。如果这些误差是均匀的且相互独立，我们可以直接使用普通最小二乘法。但是，当这些误差的方差不同时，或者误差之间存在相关性时，普通最小二乘法不再是最佳选择。此时，使用加权最小二乘法（Weighted Least Squares, WLS），目标函数变为：

$\min_\theta\sum_{i=1}^nw_i\left(y_i-f(x_i,\theta)\right)^2$

其中，wi 是观测值 yi 的权重。观测值的误差越小（更准确），它对结果的贡献越大，所以赋予它的权重 wi 越大。

4. 协方差矩阵的逆与权重分布

在加权最小二乘法中，权重 wi 通常来源于观测值的误差协方差矩阵的逆，也就是说：

$\min_\theta\left(y-f(x_i,\theta)\right)^T\Sigma^{-1}\left(y-f(x_i,\theta)\right)$

$\Sigma$ 是观测误差的协方差矩阵。
$\Sigma^{-1}$ 是协方差矩阵的逆，它提供了观测数据的权重分布。

为什么协方差矩阵的逆提供权重分布？

误差的方差：对角线元素 Var(Xi) 代表观测值 yi 的误差的方差。如果某个观测值的方差较大，它的误差就大。为了降低这些大误差观测对拟合结果的影响，我们在权重中给它分配较小的值。由于权重与方差成反比，方差矩阵的逆就体现了这个“反比”关系：误差大，权重小；误差小，权重大。
误差的协方差：非对角线元素 Cov(Xi,Xj)代表观测值 yi 和 yj 之间的误差相关性。如果 yi 和 yj 的误差相关性很强（ $\operatorname{Cov}(X,Y)$ 的绝对值很大），我们就需要降低它们的权重，避免它们共同影响模型的拟合结果。协方差矩阵的逆反映了这种相关性的处理方式，通过重新分配权重减少相互关联的观测值的影响。