反思卷积神经网络：图像角度泛化上的困难重重( 二 )

此外， CNNs将图像解析为整个主体，而不是多物体的各部件。不能明确表示不同主体及其间关系，意味着它对于未识别过的对象分析强度降低。这也意味着它以蛮力来识别图像：记忆像素不同的图像时，往往记忆细节更丰富的表示形式，而忽略物体各部件（例如，薄轮胎+框架+手柄=自行车）。
这主要是因为卷积神经网络无法像人类那样识别图像。确实，在标准数据集的完美环境中，旋转和平移不常见或不重要的简单任务下， CNNs表现良好。但是随着我们对图像处理的需求愈发增加，技术也需要被更新。
解决不变量问题的一个方法是通过空间变换，它将在预测之前定义轴和图像边界。从而帮助纠正缩放（第一行）和旋转（第二行）所存在的不平衡，以及注意机制所存在的噪点（第三行）。

本文插图
图源：空间变换网络
事实上，空间变换网络还可以消除复杂畸变。鉴于三维视角的复杂性，它还能够超越旋转和缩放变换，具有十分重要的价值。

本文插图
图源：空间变换网络
还有其他几个架构，比如最近提出的缩放不变性卷积神经网络（SiCNN）。比较出名的是Geoff Hinton提出的胶囊网络：它通过层级来明确建立识别单个部件——他认为这是人类的自然识别方法。
Hinton指出，计算机视觉的任务就是推翻计算机图形。图形程序使用分层模型，根据位置不变的矩阵计算空间结构，视角只是一个矩阵乘法。因此，图像识别网络的目的应该是寻找视角表示和''内部''对象表示之间的关系，这种关系与视角无关。
每个胶囊网络都会被分配给一个内在对象，并且通过强制模型学习特征方差来进行无特定角度识别。这使得外延性增加，意味着图像模型开始真正对镜头的所有视角有了良好的泛化及分类。胶囊网络还对空间信息进行编码，并且只进行''协议路由'' ，这意味着如果内容相似，网络仅向更高级别的图层发送较低级别特征，如眼睛、鼻子和嘴唇。

本文插图
图源：unsplash
显然，这是一个与卷积神经网络完全不同的范例。然而，也许正是这种处理图像识别的转变，才使设计数据集翻篇，转而构造出在日益复杂和按需要求的实际任务中表现更好的更智能且稳固的模型。

本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
【反思卷积神经网络：图像角度泛化上的困难重重】如转载，请后台留言，遵守转载规范

反思卷积神经网络：图像角度泛化上的困难重重( 二 )

推荐阅读

劲舞团托马斯舞步劲舞团步子

莫小帅|这情况也在中科院意料之外，真的乱了！台积电、ASML公开表白

特朗普|白宫美女新闻秘书：特朗普不想激活反叛乱法，他想尽所能帮忙

「华北新闻网」到底有多不靠谱？，深扒！晒太阳给孩子补钙

武汉火神山医院实现2/4/5G网路全覆盖

月薪1万+，事业单位，每天工作很痛苦很累，感觉自己要抑郁了，我应该辞职吗

薛定谔的猫通俗解释薛定谔的猫什么意思

武汉启圣教育培训中心■科学补充蛋白质，守护家人健康

@10年职场，我只坚持做这四点，职场越走越顺，人脉越来越宽

太空|“星链计划”已经吓退了，所有的太空竞争对手

安徽中医药大学|这个大学校长借学校更名扩建插手校园基建敛财

电视剧@感觉现在的国产电视剧越来越没啥看的了，原因有这些！

人民威评：疫情防控期间个人行踪轨迹信息的合理利用

百岁茶人张天福,天福茗茶

110平米的原木风，入户就被迷住了，全屋原木材料装饰超温馨

「萌爸育儿手帐」希望我的后半生能为自己活，一位36岁母亲的自述：前半生为他人活

冬季如何储存红薯最好冬季储存红薯用什么方法最好

辽宁高考|辽宁高考首次引入AI技术对考场违规行为进行判断

海外网|新冠肺炎成美国警察2020年首要殉职原因

功立说八卦|大小s两姐妹相互扶持，郑氏姐妹颜值很能打，圈中的明星姐妹花