AIGC产品的版权争议有“解药”吗?

【AIGC产品的版权争议有“解药”吗?】实习采访人员 | 何欣晔
编辑 | 王姗姗
AIGC领域创新产品频出的当下,与之伴随的争议和担忧也正在同步升温 。
一个月前,微软宣布旗下代码托管平台 Github 的AI生成代码辅助工具Copilot已集成了最新的GPT-4模型,开发者可以通过与机器人(11.530, 0.01, 0.09%)对话完成诸多日常工作 。但这款大热的代码工具,目前正面临着内容使用版权方面的两起诉讼 。
3月末,意大利成为首个明确禁用ChatGPT的国家;伊隆·马斯克等一千多名业界、学界人士则联署发表公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统,暂停时间至少6个月 。
上述公开信还建议,AI开发人员应与政策制定者合作,共同推出更强大的AI监管治理系统,包括内容出处与水印系统,帮助鉴别区分AI合成内容和真实内容,并追踪模型的数据来源 。
的确,大模型以“黑盒”形式迅速迭代发展,其智能程度惊艳世人,但数据内容版权保护以及由此带来的信息安全、隐私保护等问题,都未得到清晰解释 。
01
训练和输出阶段的版权争议
Copilot在2022年6月上线之初就因版权问题遭到抵制,有试用者称Copilot会直接复制粘贴大段开发者的代码 。德州农工大学计算机教授 Tim Davis 在推特上发文称,Copilot 在没有标注归属信息的情况下,输出了大段其所有的受版权保护的代码 。
程序员兼律师Matthew Butterick就旗帜鲜明地反对Copilot 。2022年11月,他联合美国Joseph Saveri律师事务所的3位律师,正式对GitHub Copilot 及其背后的微软和OpenAI公司提起诉讼 。这是美国第一起关于生成式人工智能的集体诉讼 。

AIGC产品的版权争议有“解药”吗?

文章插图
来源:Matthew Butterick博客
Butterick称,Copilot违反了开源许可协议,在模型训练阶段,使用了Github社区中的开源代码作为训练数据,但抹去了代码的归属信息 。代码的原作者信息无法在输出结果中被看到,开源社区的开发者可能会因此失去获得客户的机会 。
GitHub称Copilot生成代码的所有权和责任属于操作者 。Butterick和律师团队的诉状已提交至美国加州北区地方法院,要求批准 90 亿美元的法定赔偿金 。后来,该团队以类似的理由代表两名匿名软件开发者发起了第二起集体诉讼,被告方分别为GitHub和OpenAI 。
在今年1月提交给旧金山联邦法院的法庭文件中,两家被告公司称,原告依靠假设事件来提出索赔,并未指出其个人如何切实地受到Copilot的伤害 。GitHub表示,Copilot在工作原理上,不会夺走开源代码中的任何东西,相反,它根据从公开代码中学到的知识生成建议,帮助开发人员编写代码 。
这起诉讼的相关法庭听证会将在今年5月举行 。而AIGC领域的诉讼不止关于AI代码工具 。
今年1月,Butterick和团队还代理了三位艺术家起诉AI艺术创作工具Stability Al、DeviantArt和Midjourney的案件,指控Stable Diffusion等工具是21世纪的“拼贴把戏”,它们在未经授权的情况下使用了大量艺术作品 。今年1月到2月,美国盖蒂图片社(Getty Images)也加入起诉行列,先后在英国和美国对Stability AI提起诉讼,称其知识产权受到侵犯,被诉公司从Getty Images的数据库中复制了超过1200万张图像 。
02
“合理使用”定义模糊
这些站在被告席的AI技术公司,如果能证明在AI训练对数据的爬取中,模型训练的用途可以构成“合理使用”免责,就有可能免除内容侵权的诉讼风险 。
但是关于“合理使用”的判断,美国的版权法采取“四要素”分析法,即使用目的和性质、版权作品的性质、所使用部分的量和对作品市场的影响 。依据此标准,Copilot 对于现有代码的使用很难被纳入“合理使用”范畴 。
在使用性质方面,自2022年7月,Copilot已正式开启收费模式,具有了盈利的目的;市场影响方面,当前各种类型的AI产品生成的内容会挤压原作者的生存空间,甚至会替代原有市场 。
AI技术公司能拿出的一个对其有利的“先例”是google Books对书籍文本的使用因具有变革性而获得“合理使用”免责 。Copilot对代码的使用方式似乎也是具有变革性的,有律师认为,它的“合理使用”辩护可能因此得到支持 。
对于监管机构来说,“合理使用”认定困境主要在于,如果训练AI模型的数据不属于该范围,那么科技公司就必须向数据所有者支付版权费用,这会阻碍该新兴领域的发展;但如果认定属于“合理使用”,可能导致科技公司肆意使用人类劳动成果 。目前,英国知识产权局为促进人工智能发展,已允许出于任何目的的文本和数据挖掘行为 。


推荐阅读