[LG]《A Riemannian Approach to Low-Rank Optimal Transport》P Jawanpuria, B Mishra [ IIT Bombay & Microsoft India] (2026) 在最优传输(Optimal Transport)领域,经典算法面临O(mn)的计算瓶颈。现有低秩方法通过将耦合矩阵分解为两个子耦合矩阵来缓解这一问题,但依赖镜像下降(mirror descent)的

[LG]《A Riemannian Approach to Low-Rank Optimal Transport》P Jawanpuria, B Mishra [ IIT Bombay & Microsoft India] (2026)

在最优传输(Optimal Transport)领域,经典算法面临O(mn)的计算瓶颈。现有低秩方法通过将耦合矩阵分解为两个子耦合矩阵来缓解这一问题,但依赖镜像下降(mirror descent)的一阶更新,需要仔细调参且无法利用优化曲率信息。本文提出的黎曼几何框架将这一问题重新定义为流形上的优化:把秩为r的正因子耦合空间建模为正象限的嵌入子流形,并赋予Fisher-Rao乘积度量。

核心突破在于:将边际约束从迭代投影中剥离,转化为流形的几何结构本身。对于平衡OT,切空间投影需要求解一个条件数接近1的Schur补系统;对于非平衡OT,投影和回缩操作完全退化为闭式缩放,彻底消除内层循环。这种几何视角使得黎曼梯度和Hessian-向量积的计算与具体代价函数(线性OT、Gromov-Wasserstein、融合GW)解耦——切换任务只需替换欧氏梯度,流形操作保持不变。

这项工作的真正遗产是:它证明了非平衡OT的复杂度可以降至O(rN)且无需内层迭代,这是镜像下降框架根本无法达到的。它还提供了秩充分性证书,可后验验证秩r解是否为全秩问题的全局最优。但尚未跨过的门槛是:当前框架在低秩(r≤10)时相比镜像下降的单次迭代成本略高,且对非凸GW问题仍可能陷入局部极小值——二阶信息虽有帮助,但不保证全局收敛。

arxiv.org/abs/2606.12120 #机器学习# #人工智能# #论文# #AI创造营#

发布于北京