小米大模型应用团队提出SVOR(Stable Video Object Removal)框架,通过MUSE窗口化联合策略、DA-Seg去噪感知分割、课程式两阶段训练三大核心技术,针对性解决真实场景中阴影残留、运动抖动、遮罩缺陷等问题,在多个标准数据集和退化遮罩基准上达到新SOTA水平,荣获CVPR 2026 物理感知视频实例消除挑战赛第一名,代码现已完整开源! http://t.cn/AXxXvf6D
发布于 北京
小米大模型应用团队提出SVOR(Stable Video Object Removal)框架,通过MUSE窗口化联合策略、DA-Seg去噪感知分割、课程式两阶段训练三大核心技术,针对性解决真实场景中阴影残留、运动抖动、遮罩缺陷等问题,在多个标准数据集和退化遮罩基准上达到新SOTA水平,荣获CVPR 2026 物理感知视频实例消除挑战赛第一名,代码现已完整开源! http://t.cn/AXxXvf6D