#小米影像算法取得技术突破#
三项核心算法突破解析
小米此次的技术突破主要集中在图像超分辨率、人像修复与反光消除三大赛道,其底层逻辑均指向计算摄影的效率与画质双提升:
高效超分辨率赛道(冠军)
小米玄戒多媒体算法团队推出的 SPAN V2 算法以综合得分 4.43 登顶。该算法实现了两项核心优化:一是网络能根据画面内容自适应分区优化,不再用固定策略“一刀切”处理全图;二是将GPU注意力计算中原本需要三次读写显存的步骤合并为一次。这使得模型在画质近乎无损的前提下,大幅降低了计算开销并提升了推理速度。
人像修复赛道(冠军)
针对老照片模糊、压缩损伤等复合退化问题,小米大模型应用团队采用了 双阶段级联框架:
粗修复稳结构:先通过OSDFace模型恢复人脸整体结构和五官布局;
单步扩散细纹理:再利用Z-Image单步扩散模型细化皮肤、发丝等高频细节,有效避免了传统生成式算法容易出现的“人脸失真”与“身份不一致”问题。
反光消除赛道(亚军)
在RDNet-XL架构基础上,团队创新引入扩散模型知识蒸馏策略,配合三阶段渐进式多分辨率训练(从384到768分辨率渐进)。该方案不仅能高效去除玻璃、水面等复杂反光,还完整保留了原生场景的细节,在多项客观指标中位列赛事第一。 http://t.cn/AXidqxP1
发布于 广东
