【何恺明带领三位大一新生提出扩散模型新思路:去除噪声调节不仅可行,有时还能提升性能】
#扩散模型# 的工作原理是在训练过程中,将不同程度的噪声添加到原始数据中,然后训练#神经网络学习# 如何逐步去除这些噪声。在这个过程中,噪声水平(用 t 表示)作为额外的条件信息输入给神经网络。
这种设计自 2015 年 Sohl-Dickstein 等人提出以来就被视为扩散模型的标配,并在后续的 DDPM、Stable Diffusion 等知名模型中得到继承。
但美国 MIT 副教授何恺明团队最近但一项成果却对扩散模型的基础架构提出了一个根本性的质疑:被广泛认为不可或缺的噪声调节,真的那么重要吗?
他们的灵感来自传统的图像处理中的“盲去噪”(blind denoising)技术。在#计算机# 视觉研究中,科研人员早已发现,即使不知道具体的噪声水平,仅从被污染的图像本身也能较好地完成去噪任务。这促使研究团队思考:这一发现是否也适用于扩散模型?
戳链接查看详情:http://t.cn/A61i69UE
