小米影像算法突破

#小米影像算法取得技术突破#
三项核心算法突破解析
小米此次的技术突破主要集中在图像超分辨率、人像修复与反光消除三大赛道，其底层逻辑均指向计算摄影的效率与画质双提升：
高效超分辨率赛道（冠军）
小米玄戒多媒体算法团队推出的 SPAN V2 算法以综合得分 4.43 登顶。该算法实现了两项核心优化：一是网络能根据画面内容自适应分区优化，不再用固定策略“一刀切”处理全图；二是将GPU注意力计算中原本需要三次读写显存的步骤合并为一次。这使得模型在画质近乎无损的前提下，大幅降低了计算开销并提升了推理速度。
人像修复赛道（冠军）
针对老照片模糊、压缩损伤等复合退化问题，小米大模型应用团队采用了双阶段级联框架：
粗修复稳结构：先通过OSDFace模型恢复人脸整体结构和五官布局；
单步扩散细纹理：再利用Z-Image单步扩散模型细化皮肤、发丝等高频细节，有效避免了传统生成式算法容易出现的“人脸失真”与“身份不一致”问题。
反光消除赛道（亚军）
在RDNet-XL架构基础上，团队创新引入扩散模型知识蒸馏策略，配合三阶段渐进式多分辨率训练（从384到768分辨率渐进）。该方案不仅能高效去除玻璃、水面等复杂反光，还完整保留了原生场景的细节，在多项客观指标中位列赛事第一。 http://t.cn/AXidqxP1

发布于广东