虾仁芝麻卷· 25-11-13 12:22
微博认证:微博新知博主 法律博主

没想到第一个因为训练AI模型侵权音乐作品被判的不是Suno这些AI音乐模型,而是OpenAI。

11月11日,德国慕尼黑法院做出判决,支持德国音乐版权协会GEMA起诉,认定OpenAI侵权9首歌曲歌词(去年11月份起诉,今年11月份判决。慕尼黑法院这个效率是真高,没有暗示部分法院案子周期比较久的意思)。

双方主要是围绕三个点展开对抗的。

第一个,是否构成德国版权法禁止的复制。

法院认为歌词被"记忆化"存储在模型参数里了,因为使用简单提示词就能让ChatGPT稳定逐字吐出9首歌曲的歌词。模型不但学会了如何写歌词,同时也把原歌词记忆了下来,符合“有形固定”和“可再现”,属于复制。

这里OpenAI其实还提了因为AI幻觉,有时候输出有错误。但法院不买账:著作权侵权不要求完全一致,只要"实质性相似"就够了,输出了歌词的主要部分和核心表达,就构成侵权

第二个,是否符合文本挖掘(TDM)的例外情况

TDM例外只保护"为了分析目的"的临时复制。而OpenAI已经歌词持久记在模型里,超出"临时"范围。另外拿模型商用赚钱,也超出"研究分析"目的。TDM例外的前提是"不影响权利人的正常利益"。但ChatGPT能直接输出歌词,用户本来需要付费获取的内容,现在免费拿到了,直接损害版权方的市场利益。

法律允许你为了学习临时抄笔记,但不允许你把笔记永久保存、拿出来卖钱,还让别人不用买原版教材了。

第三,OpenAI是直接侵权人,还是用户侵权。

OpenAI主张是用户输入提示词要歌词的,他们只是工具。法院也驳回了。

还记得上面提到过的,法院测试发现:简单、通用的提示词就能触发侵权输出,这不是用户"诱导"出来的,而是模型本身就具备侵权能力。别甩锅给用户。就是你OpenAI的问题。

还有个小插曲。OpenAI在法庭上说:"我们6个月就能训练出新模型。"法院直接拿这话当证据:既然技术上能重新训练,那就别喊冤说"删除数据成本太高",赶紧用合法数据重新训练去。你越强调技术先进,法院越觉得你有能力合规。

这判决一出,所有大模型公司都得慌。

这案子的杀伤力在于:法院用传统著作权法的"复制"构成要件,精准打击了大模型训练的核心环节。以前AI公司觉得"训练不只是记住原理不侵权"。现在法院告诉你:模型只要能复现原文就是复制,复制就需要授权。

接下来要么花钱买授权(跟GEMA这样的版权组织谈判),要么开发"防记忆化"技术(让模型记不住原文),要么可能就只能等着吃官司了。

判决虽然只是一审,OpenAI还可以上诉。但这个新的解决问题的思路,会不会被其他案件的法官借鉴?以后版权方是不是会更好维权了?一场席卷全球的AI版权战才刚开场。
#律师开放麦##ai#

发布于 北京