《财富》封面:全球爆红的ChatGPT是如何诞生的?( 七 )


法院和监管部门也可能对生成式人工智能所依赖的数据飞轮横插一脚 。向加州联邦法院提起的一起金额高达90亿美元的集体诉讼,可能对该领域产生深远影响 。该案原告指控微软和OpenAI使用程序员的代码训练GitHub的编程助手Copilot,没有承认程序员的功劳或者对程序员予以补偿,违反了开源许可条款 。微软和OpenAI均拒绝就该起诉讼发表意见 。
人工智能专家表示,如果法院判决原告胜诉,可能会阻碍生成式人工智能的繁荣:大多数生成式人工智能模型都是使用从互联网上搜刮的材料进行训练,并没有取得许可或支付报酬 。作为该案原告代理人的律师事务所,最近还提起了一起类似诉讼,指控Stability AI和Midjourney未经许可,在训练数据中使用了有版权保护的美术作品 。盖蒂图片社(Getty Images)也对Stability AI提起了版权侵权诉讼 。另外一个问题是,立法者可能通过法律,授予创作者禁止将其创作的内容用于人工智能训练的权利,例如欧盟的立法者正在考虑这样做 。
与此同时,OpenAI的竞争对手并没有坐以待毙 。据《纽约时报》(New York Times)报道,失去搜索领域主导地位的可能性,已经促使谷歌高管发布了“红色警报” 。报道称,谷歌CEO桑达尔·皮查伊已经多次召开会议,重新制定公司的人工智能策略,计划发布20款支持人工智能的新产品,并将在今年发布搜索聊天界面的演示版本 。谷歌拥有一款强大的聊天机器人LaMDA,但由于担心一旦该产品被滥用可能影响公司信誉,因此一直未对外发布 。据《时代》杂志引用谷歌的内部报告和匿名知情人士的话称,现在,公司计划以ChatGPT为标杆“重新评估”其风险承受能力 。该杂志报道称,谷歌还在开发一款文本转图片的生成系统,与OpenAI的DALL-E等产品竞争 。
当然,目前尚不确定聊天机器人是否代表了搜索行业的未来 。ChatGPT经常会杜撰信息,这种现象被人工智能研究人员称为“幻觉” 。它无法可靠地引用其信息来源,或简单地提供链接 。现有版本无法访问互联网,因此无法提供最新信息 。马库斯等人认为,幻觉和偏见是大语言模型存在的根本问题,需要彻底重新思考它们的设计 。他表示:“这些系统可以预测句子中单词的顺序,类似于开发工具Steroids上的代码自动补全 。但它们实际上并没有任何机制,能够跟踪其表述的内容的真实性,或者验证这些内容是否符合它们的训练数据 。”
“这些系统可以预测句子中单词的顺序,类似于开发工具Steroids上的代码自动补全 。但它们实际上并没有任何机制,能够跟踪其表述的内容的真实性,或者验证这些内容是否符合它们的训练数据 。”
——纽约大学认知科学专业荣誉退休教授加里·马库斯
其他人预测,这些问题将在一年内得到解决,其中包括OpenAI的投资人霍夫曼和维诺德·科斯拉 。穆拉蒂则更加慎重 。她说道:“我们到目前为止一直遵循的研究方向,目的是解决模型的事实准确性和可靠性等问题 。我们正在继续朝着这些方向努力 。”
事实上,OpenAI已经公布了对另外一个版本GPT的研究 。该版本名为WebGPT,可以通过查询搜索引擎和汇总查询到的信息来回答问题,包括对相关来源的注释 。WebGPT依旧不完美:它会接受用户问题假设的前提,然后查找确证信息,即使这个前提是错误的 。例如,在被问到盼望某件事情发生是否能令其真实发生时,WebGPT的回答是:“你确实可以通过思考的力量,使愿望成真 。”
阿尔特曼极少在公开场合热烈讨论人工智能 。在谈到人工智能的时候,他可能听上去像是一位幻想思想家 。在旧金山举办的风险投资活动上,当被问到人工智能的最佳状况时,他夸张地说道:“我认为最好的情况好到令人难以想象……好到谈论它的人会令人觉得这人是个疯子 。”他突然又将话题转回到OpenAI核心的反乌托邦主题:“我认为最糟糕的情况是,我们所有人都死去 。”

【《财富》封面:全球爆红的ChatGPT是如何诞生的?】


推荐阅读