解释什么是图灵测试 谈谈你了解的图灵测试,是谁第一个通过的这个测试

对于人工智能的话题,人类永远包含着一种若即若离的情绪,我们既希望这些科技的产物达到类似我们的功能,又担心过高的相似度会带来科幻电影中的灾难 。于是有一些有趣的科学家们开始设计一系列的实验来探索我们与人工智能选择上的区别,以进一步揭示两者的根本性区别 。你会比机器人更具有人性吗?首先你要做出一个艰难的选择.....
随着计算机变得越来越智能,我们可以用一些非常简单的方法来区分我们和机器吗?
假设你和一个智能机器人都站在一个无法得知二人真实身份的的法官面前 。法官的任务就是出你们当中谁是人类,另一个(机器人)就会被宣判死刑,但问题是你和机器人都想活下去 。公正又聪明的法官说:“你们每个人必须从英语字典里给我一个单词,我会根据这个单词将猜出谁是人类 。
你会选哪个词呢?
上面故事里的人类会选择像“灵魂”这样高大上的词汇吗?或者选择一个反应出个人品味的东西,比如“音乐”?或者是一些描述身体功能的单词,比如“放屁”?
这个简单的思维实验可能看起来有些异想天开,但一些认知学科学家认为,对这个实验的思考有助于阐明我们对人工智能的基本假设,同时也揭示出一些关于我们自己大脑的惊人解释 。
毕竟现在一些聊天机器人和语言生成机器正在越来越多的使用人工智能技术与我们进行对话,或生成我们每天用到的大量文本 。例如,我们怎么判断与我们在线聊天的客服代表是人类还是机器?或者你看到的一个虚构的故事是由机器炮制出来的,还是由作家精心创作出来的呢?交流型人工智能不再是一个纯粹的理论假设,我们需要做好应对一切的准备 。
麻省理工学院一位从事这项研究的研究员约翰•麦科伊表示,做出这个实验是他最初受到与同事闲聊时的启发 。他们当时正在讨论1950年由英国科学家艾伦·图灵首次开发出的图灵测试,该测试旨在测量机器的智能行为是否会与人类的智能行为有着不可分辨的高相似度 。
在这个测试中,每个评委都有一个标准的聊天界面 。在每一场审判中,他们可能与真人交谈,也可能与由人工智能驱动的电脑聊天机器人进行沟通,而法官的工作就是猜出谁是聊天机器人 。如果聊天机器人成功骗过了一定比例的法官,那么它就通过了图灵测试 。
“我们想知道图灵测试的微型版本是什么”约翰·麦考伊说,然后猜测机器是否能被一个词暴露出自己的真实身份 。当时的问题是,人类会说些什么词汇呢?正是这个问题启发了今年发表在《实验社会心理学杂志》上的一篇研究论文 。
在第一个实验中,约翰·麦考伊和他的同事托默厄尔曼让1000多名参与者回答了上述问题,然后分析他们说出的单词,以便他们找到其中隐藏的一些共同的模式 。
根据被说出单词的受欢迎程度,排名前十的单词是:
爱(134个选择)同情(33)人类(30)请(25)慈悲(18)移情(17)情感(14)机器人(13)人性(11)活着(9)
现在在宾夕法尼亚大学工作的约翰·麦考伊表示:“人与人之间的相似程度令人震惊 。”“他们可以从标准英语词典中选择任何自己喜欢的单词,但个体之间却存在很大的相似度 。”
例如“爱”这个词——大约10%的参与者选择了这个词,而不是其他成千上万种可能;总的来说,四分之一的参与者选择了排名前四的单词中的一个 。
在主题方面,他们发现表达身体功能(如“排泄”)的、信仰和宽恕(如“怜悯”或“希望”)、情感(如“同理心”)和食物(如“香蕉”)的词汇是最受欢迎的类别 。
然后,约翰·麦考伊和厄尔曼进行了第二个实验,他们想知道其他人对第一个实验中选出的词会有什么反应 。最受欢迎的词汇真的像最初的参与者所认为的那样,成功地传达了一种人性的倾向吗?如果是这样,哪一个词是最有代表性的呢?

解释什么是图灵测试 谈谈你了解的图灵测试,是谁第一个通过的这个测试

文章插图
为了找到答案,研究人员将最受欢迎的单词以不同的组合组合在一起(如“人类”和“爱”),并要求另一组参与者确定这两个单词中最有可能由人类还是被机器选择的 。明知故犯的藐视一些禁忌、表达某种情感可能是传达人类共同人性最直接的方式
正如我们在第一项研究中看到的,“爱”是最受人类欢迎的选择 。但在所有选项中,排名最高的词是“拉屎” 。粪便竟然才是人类的“希伯列斯”(编程中用来建构身份认同的代码),这结果似乎令人惊讶,但研究结果表明,有意地藐视禁忌、引起愤怒的情绪,而不是简单地描述一种情绪,可能是传达共有的人性最直接的方式 。其他一些被视为人类独有的词汇也会引发类似的强烈情感反应,但很多超出了词典的定义 。例如,“潮湿”或“请” 。你可以试着将这些“拟声词”大声的说出来几次 。


推荐阅读