AIGC会是下一个万亿级AI风口吗( 六 )


2、“人工智能宣布放弃版权”
AI 作画的一个很大的争议点在于版权 。例如,DALL-E 和 Stable Diffusion 等图形生成类 AI 工具就被质疑在互联网上随意抓取数据,且完全没有考虑过任何许可或所有权限制 。正是由于这种版权归属争议的存在,Shutterstock 和 Getty Images 等公司禁止在其平台上使用 AI 生成图像 。
谈到版权问题,李笛表示,小冰很早就提出,“人工智能宣布放弃版权” 。
通常来说,版权界定需要几步:第一判定是不是侵权 。人类作品判定侵权有明确的界定要求,比如一个作品多少比重的内容一致,就可以判定侵权 。人工智能作为系统,它天生就有判定机制,当它输出作品的过程中,它自动就可以像知网一样进行查重 。它生成的原始图像里,很可能存在着很多图像跟现有的作品,存在相似性,如果相似性较高,侵权了,只要不把作品输出就行 。如果让人工智能确保它给到用户的每一个作品都是不侵权的,这件事很容易做 。
第二步要有判定训练的过程,是基于什么样的训练数据训练的 。但要注意的是,无论是人类作品还是 AI 生成作品,侵权的责任认定在于,这张作品是不是跟另一个作品产生了相似性,而并非在学习作画的过程中学习了别人的作品及作品思想等 。如果这样,无论是人还是 AI 只要在画画,便会判定为侵权 。从这个角度看,人工智能本身在训练过程不存在版权责任,尤其是大模型,因为人工智能在训练的时候,它使用的是公开的数据来进行训练 。
另一个放弃版权的原因在于,人工智能保留知识产权没有意义 。人工智能保留知识产权的一个先决条件是必须要经过确权的步骤 。目前全球对于知识产权的确权方法主要是通过著作权登记,每登记一个作品,需要一笔著作权登记费用 。而 AI 生成的内容规模十分庞大,这一规则对 AIGC 来说显然不现实 。
3、无法辨别真伪信息的世界
很多人担忧,随着 AIGC 的不断普及,未来大家将生活在一个无法辨别真伪信息的世界里 。
AIGC 生成的内容越来越多,信息的真假会成为很大的负担 。但这恐怕已经是无法避免的趋势,因为现在 AI 生成的图片早已经是海量规模,而且,这些 AI 生成的数据将会越来越多的出现在公共的资讯平台上,这样的时代正在快速到来 。
对于用户来说,未来将面临判定真伪信息的挑战 。目前还少有比较好的解决这一问题的方法 。赵德丽提出了一种标记的方法 。从算法角度来说,可以做一些隐性标记,标记出哪些图片是生成的,哪些是真实的图片 。
完全的 AIGC 可能不会出现
不可否认的是,AIGC 对内容创作的确产生了重大影响 。一种观点认为,内容生成的四个阶段依次为“PGC、UGC、AI 辅助生成和完全的 AIGC” 。按照这一走向,未来,AI 的终级趋向会是取代人,最后内容产业将走向完全的 AIGC 。
李笛对此持有相反的观点,他认为,AI 的终极应该是与人协同,应该先实现“规模化的 AIGC”再到达“AI 辅助生成”阶段,当 AIGC 集大成以后,再辅助人类生成内容 。
此外,完全的 AIGC 可能不会实现 。比如人看某个电影,是因为情节、演员、导演等多种因素 。人类对作品的喜好,从来不仅仅是因为内容质量,即便未来完全的 AIGC 化了,可能也并不是人类想要的东西 。李笛发出思考:“所以不存在 AIGC 颠覆人的可能性,颠覆的是人,实际上是驱逐了人” 。
赵德丽表示,AIGC 本身是基于生成模型产生的能力,生成模型训练需要数据,这些数据都是人类活动产生,生成的提示词需要人来输入,人需要做场景的设计、提示词的设计、元素的设计等等 。只不过在一些具体的场景上,对于一些固定的设计模式,比如设计成具体的图形如红包界面、商品素材等,可以实现完全的 AIGC 的方式 。但整体而言,人还是 AIGC 中重要的因素 。
再回到那个 AI 能不能让艺术家丢掉饭碗的老生常谈的话题 ——“让 AI 负责生成,让艺术家或设计师来负责审美,这两个并不矛盾,是一个相辅相成的关系 。也不存在谁取代谁,有了 AI 绘画的辅助,艺术家会发挥出更大的能力,甚至说一些不是非常专业的艺术家,一些平民老百姓,借助 AIGC,也有可能创造出非常惊艳的艺术品” 李笛表示 。
采访嘉宾:(按拼音首字母排序)
百度 ERNIE-ViLG 团队
黄民烈,清华大学计算机科学与技术系长聘副教授、博导,聆心智能创始人 。
李笛,小冰公司 CEO


推荐阅读