盲视科幻小说 盲视


盲视科幻小说 盲视

文章插图
失明(对科幻小说视而不见)
作者|穆青
编辑|簇尾
6月22日,北京致远大会举办了以认知神经科学为基础的专题论坛 。北京师范大学认知神经科学与学习国家重点实验室毕彦超教授、北京大学心理与认知研究所方芳教授、北京师范大学心理学系刘佳教授、北京大学计算机系伍肆教授、中科院自动化所于山教授分别发表演讲,探讨认知神经科学能给AI带来哪些启示 。
第四位演讲者是北京大学计算机系的伍肆教授,他的演讲题目是“生物视觉与计算机视觉的对话” 。
在报告中,伍肆教授指出,生物的视觉识别机制和深度神经网络的图像识别机制有很大的不同 。对生物体的视觉识别涉及自上而下和自下而上两条通路的相互作用,而深度神经网络只模拟第二条通路 。自顶向下的视觉通路涉及到生物视觉感知的全局、拓扑和多解特性,特别是在理解图像时,会面临数学无穷解的问题,而这些特性可能是深度神经网络下一步的改进方向 。
以下为演讲全文,AI技术回顾在不改变初衷的情况下进行了整理 。
我报告的内容是生物视觉与计算机视觉研究的相互影响,以此来说明神经科学与人工智能研究的互动关系 。这两个领域本质上都是在解锁智力的黑箱,所以它们相互启发是非常自然的 。
一个
深度神经网络只是模拟了生物视觉的一部分 。深度神经网络是近年来人工智能的引擎,已经非常成功 。在一些大型数据集中,物体的识别率甚至超过了人类 。然而,深度神经网络仍然面临许多问题 。
第一,深度神经网络更多的是模拟大脑视觉皮层中的前馈和层次结构信息处理 。但是大脑的视觉系统比这个复杂得多,所以在很多行为上,人脑和深层神经网络有很大的不同 。在许多任务中,人们表现得更好 。
举个简单的例子 。如下图,左边有一只熊,熊的局部信息已经去掉,只剩下轮廓,我们人类一眼就能认出它是熊 。右图是熊被分成小块,然后被打乱,只留下局部信息,没有全局信息 。我们可以发现,这些小块包含了熊的眼睛、嘴巴和身体,但是很难识别出右图是熊,而深度神经网络可以一眼识别出右图是熊 。
通过对比可以发现,深度学习网络的物体识别机制与人类有很大不同 。人类信息资源网络可以获取对象的全局信息进行识别,但目前深度神经网络只能利用局部信息进行识别 。
无法获取全局信息是深度学习面临的一个基本问题,尤其是前馈神经网络,这一点已经实现了很长时间 。人工智能的先驱马文·明斯基在1969年指出,前馈神经网络很难识别拓扑属性 。
拓扑学是研究几何图形或空在连续改变形状后仍能保持不变的一些性质的学科 。它只考虑物体之间的位置关系,而不考虑它们的形状和大小 。在拓扑学中,重要的拓扑性质包括连通性和紧性 。
前馈网络很难获得全局信息,即使要获得,计算复杂度也会成倍增加 。拓扑信息和全局信息的获取是深度学习网络面临的基本问题 。
因此,我们有必要了解生物视觉系统如何获取全局信息 。神经科学领域一直有一个广泛的争论,即人类是根据全局信息还是局部信息来识别物体 。与这两种观点相对应的典型例子是绘画的两个流派 。如下图所示,左图属于印象派 。如果只看局部,看不清眼睛或者鼻子,但是从整体上辨认就能知道这是个男人 。这是从全局信息中识别对象的一个例子 。右图属于立体派 。这张图片特别放大了每一个局部信息 。毕加索说画面是一个美丽的少女,但很多人认为看不到,因为局部信息无法组合成整体信息 。这是一个从局部信息识别物体的例子 。
深度学习网络通过聚合局部信息,逐步构建复杂信息来识别物体 。相反,认知神经科学领域有一种理论叫做“逆层次理论”,指出人类对物体的认知是从简单到复杂,从整体到局部的 。
“逆层次理论”与我们的生活经验是一致的 。如果一个人在我们的视野中一闪而过,你会立刻意识到这是一个个体,进而识别出对方的身份 。这是一个从整体到细节的认知过程 。
从神经科学的角度来看,我们看到了人类视觉认知和机器学习之间的显著差异 。下图是一个实验,实验对象是盲人 。盲视是指意识层面“看不见”物体但能“感知”物体的存在 。
大量实验表明,为了看到或意识到物体,人类至少需要在视觉皮层V1中接受物体的信息 。如果V1受损,可能会失明 。此时能够感知物体是因为皮层下通路仍然存在,这是一条从视网膜到上丘再到更高皮层的短通路 。


推荐阅读