Machine Unlearning是最近几年因为人工智能技术广泛应用后所产生的一个新的领域。这个领域主要是因为立法以及隐私的要求,特别是在一些国家和地区(比如欧盟)对于人工智能的部署有明确法律要求的情况下,部署的应用能够根据要求把一些训练数据的影响给消除。
CVPR 2024上,来自Michigan State University、UC Santa Cruz、IBM Research和Google的学者组织了一个比较全面的短课程“Machine Unlearning in Computer
Vision: Foundations and Applications”(http://t.cn/A6gZDWaM),来对这个领域在视觉领域的发展进行了一个总结。
Machine Unlearning最基础的概念异常简单,那就是有一些希望删除的训练数据,我们如何能够通过某种流程,得到一个模型和把这些数据完全删除重新训练达到类似(甚至相同)的效果。当然,这个定义本身还有很多更加复杂的情况,比如在Federated Learning的情况下, 没有比较好的模式把数据汇总,因此有可能只能得到近似的效果。
即便是针对默认的情况,Machine Unlearning也有很多的挑战,目前来看这个领域还是在一个早期的摸索阶段。并没有完全成熟的算法和步骤。建议对实际部署以及欧盟立法有兴趣的朋友浏览这个短课程(大约花费30分钟)。
发布于 美国
