【#警惕AIGC数据污染稀释人类原创#】 #AIGC数据需要清污了# 生成式人工智能技术的迅速发展,为人们的学习生活工作带来了诸多便利,也极大地促进了内容创作行业的发展。
生成式人工智能的普及,使数据规模以摩尔定律的速度快速增加,“全球新产生的数据量每两年翻一番”,互联网上每日新增的图片、语料等内容中AI生成内容的占比已经远远超过了真实的、人类生产的内容。随之而来的是数据质量和数据污染问题,诸如深度伪造、偏见和有害内容生成、有效数据“稀释”等。大量低质量或不客观的数据充斥其中,不仅对模型的训练产生负面影响,甚至可能导致错误的决策和偏差。这种数据质量问题,引发了人们对“数据污染”的担忧。
AIGC数据需要“清污”。现存的隐私保护、知识产权和数据信息相关的法律与大数据时代已经不匹配。面对互联网上新增的海量原始数据,我们亟须构建完善的数据内容维护、数据质量管理和数据安全监管体系。 http://t.cn/A6EgZ7tp
