POT项目快速入门：最优传输理论与机器学习实践指南-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00444/article/details/148862866

POT项目快速入门：最优传输理论与机器学习实践指南

为什么需要最优传输(Optimal Transport)？

最优传输理论由Gaspard Monge在1781年提出，旨在解决分布间质量转移的最优方案问题。在机器学习领域，OT已成为衡量分布相似性和建立样本对应关系的重要工具。

OT的核心价值体现在两个方面：

Wasserstein距离：衡量分布间的相似程度
最优传输映射：建立分布间的对应关系

与传统f-散度（如KL散度、JS散度）相比，Wasserstein距离在分布支撑集不相交时仍能提供有意义的比较结果，且具有良好的次梯度性质，使其在机器学习优化问题中表现优异。

POT工具箱的核心功能

1. 经典最优传输问题求解

对于离散分布，OT问题可表述为线性规划：

min_γ ∑γ_{i,j}M_{i,j}
s.t. γ1 = a; γ^T1 = b; γ ≥ 0

POT提供两种计算方式：

ot.emd()：返回最优传输矩阵γ*
ot.emd2()：直接计算Wasserstein距离

# 计算最优传输矩阵
T = ot.emd(a, b, M)  

# 计算Wasserstein距离
W = ot.emd2(a, b, M)

2. 特殊情况的高效处理

POT针对特殊场景提供了优化实现：

一维分布：使用ot.emd_1d和ot.emd2_1d，复杂度仅为O(nlogn)
高斯分布：提供闭式解计算，通过ot.gaussian.bures_wasserstein_mapping直接获取Monge映射参数

3. 正则化最优传输

POT支持多种正则化OT问题求解，最常用的是熵正则化：

min_γ ∑γ_{i,j}M_{i,j} + λ∑γ_{i,j}log(γ_{i,j})
s.t. γ1 = a; γ^T1 = b; γ ≥ 0

熵正则化使问题严格凸且平滑，POT提供多种求解算法：

# 基础Sinkhorn算法
ot.sinkhorn(a, b, M, reg=1.0)

# 稳定化版本（推荐小正则化参数时使用）
ot.sinkhorn(a, b, M, reg=0.1, method='sinkhorn_stabilized')

# 对数空间版本（适合梯度计算）
ot.sinkhorn(a, b, M, reg=1.0, method='sinkhorn_log')