AI科技评论TB困扰人工智能50多年的常识问题,是否迎来“破局”?( 三 )
它的出现 , 为联合使用传统符号推理和深度学习来研究常识推理 , 提供了新的思路 , 进而为同时解决覆盖性和脆性问题提供了方向 。
任何人都能够使用日常语言在COMET中输入相关的提示符 , 如果对应的事件已经在系统的常识知识库中表示出来了(例如在餐馆点餐往往就意味着你要吃饭) , COMET可以轻易地使用先前存在的信息进行推理 。 而对于没有在系统的常识知识库中表示出来的事件 , 神经语言模型也实现了最好的预测结果:
通过实验 , COMET生成的这些预测 , 人类评估小组认为平均有77.5%的结果是“可信的” , 这比人类水平差了不到10个百分点 。 例如 , 当被输入“某X 给了某Y 一些药片” , COMET推测出”某X 想要帮助某Y“;当被输入“某X 谋杀某Y 的妻子” , COMET则预测“某X 想要藏尸” 。
上述例子说明了COMET在处理超出其内置常识以外的输入方面(即覆盖性)的不错表现 , 那脆弱性问题呢?
结果证明 , COMET在解决脆弱性问题上 , 也可圈可点 。
例如 , 当用方言以一个五岁小女孩的语气在COMET输入提示:“爸爸去上班了” , 它的预测结果包括:爸爸想赚钱 , 工作 , 拿工资;他是努力工作的、有动力的、尽职尽责的;所以 , 别人对他引以为傲、心存感激 。
针对前文中Marcus 用来测试GPT-2的句子:
当你把引火柴和木头堆在壁炉里 , 然后往里面扔几根火柴时 , 你一般是要......
叶锦才也曾将同样的句子也输入到了COMET中 , 它产生了 10 个推断 , 并且前两个都与火相关 。
暂且先不论COMET是否具备了真正的常识 , 它上述案例中的表现倒确实可以说是让计算机离常识近了一大步 。
4 COMET , 是阶梯还是火箭?
Gary Marcus 喜欢用这么一句话来描述人工智能目前的进展:仅仅建好了一架更好的阶梯 , 并不意味着你就建好了一架通往月球的阶梯 。
就拿COMET 来说 , 这一方法也面临着深度学习的一个根本性的限制:统计≠理解 。 虽然COMET在预测某个句子可能包含的参数上 , 表现不错 , 但是这并不等于它能够理解这个句子 。
正如现有的阶梯一样 , 即便再高 , 也不可能通达月球 。 神经网络无论在模仿语言模式上表现得多么娴熟 , 即便真的“知道”把点燃的火柴扔到木柴上通常会引发火灾 , 但这并不意味着它真正具有常识 。
叶锦才也赞成Gary Marcus的这一观点 。 她承认COMET在训练数据时“依赖表层的语言模式” , 而不是由于真正理解相关的概念来做出回应 。 不过 , 如果能够给该模型提供更富有信息量的模式 , 它确实能表现得不错 , 这也是一个重大的进展 。
那什么才是更富有信息量的模式呢?一些研究者认为 , 要想让计算机建立真正的常识 , 需要利用语言本身以外的媒介 , 例如视觉感知或具象感觉等 。 其中 , 更直接的“第一人称”表示作为常识的基础 , 而语言则作为常识的第二层 。
比方说 , “apple”一词在一些语境中并不是指一个“苹果” , 这就需要除语言本身以外的某种形式来表示这样的意义 。
Salesforce 的高级研究科学家Nazneen Rajani也在在朝着类似的目标努力 , 她认为神经语言模型的潜力尚未被完全开发出来 。 她表示 , 现实世界非常复杂 , 而自然语言则像是现实世界如何运行的低维的指标 , 人类现在可以教神经网络从文本提示中预测下一个词 , 但这不应该是它们的极限 , 它们还能学习到更加复杂的东西 。
虽然COMET可能还存在很多缺陷 , 尚且无法成为到达其他星球的火箭 , 但是它是目前能够“脱离地面”的唯一阶梯 。
正如丘吉尔所说的:“在我们已经尝试过的政治体制中 , 民主是最好的了 。 ”
推荐阅读
- 科技圈|4299元起iPhone 11跌至谷底价,华为小米等国产手机真难过
- 科技壹角|须眉便携剃须刀:轻薄如“打火机”,随身携带,时刻保持最佳状态
- 小墨看科技|手机游戏蓝牙耳机哪款好?618游戏蓝牙耳机购买清单
- V叔科技|颜值在线,好音质回归初心!Taylou T19真无线蓝牙耳机体验
- 小虔科技|华为和小米都曾经学习苹果3D面部识别,为啥现在不用了
- 辰宜科技|区块链技术与应用专题分享交流会
- 科技小语|骁龙865直降9000元,三星AMOLED屏+4500mAh+59万分跑分,很超值
- 科技侦探社|是平板也是电脑,联想YogaDuet二合一笔记本实现工作娱乐两相宜
- 大嘴猴侃科技|苹果公司突然宣布!iPhone最高直降2000元,国产手机面临严峻考验
- 科技美学|拯救者电竞手机入网:90W充电功率、双USB - C接口、侧边弹出式摄像头