图解3种常见的深度学习网络结构:FC、CNN、RNN
导读:深度学习可以应用在各大领域中 , 根据应用情况的不同 , 深度神经网络的形态也各不相同 。
常见的深度学习模型主要有全连接(Fully Connected , FC)网络结构、卷积神经网络(Convolutional Neural Network , CNN)和循环神经网络(Recurrent Neural Network , RNN) 。
它们均有着自身的特点 , 在不同的场景中发挥着重要作用 。 本文将为读者介绍三种模型的基本概念以及它们各自适用的场景 。
作者:刘祥龙 杨晴虹 胡晓光 于佃海 白浩杰 深度学习技术及应用国家工程实验室 百度技术学院
来源:华章科技
文章插图
01 全连接网络结构全连接(FC)网络结构是最基本的神经网络/深度神经网络层 , 全连接层的每一个节点都与上一层的所有节点相连 。
【图解3种常见的深度学习网络结构:FC、CNN、RNN】全连接层在早期主要用于对提取的特征进行分类 , 然而由于全连接层所有的输出与输入都是相连的 , 一般全连接层的参数是最多的 , 这需要相当数量的存储和计算空间 。
参数的冗余问题使单纯的FC组成的常规神经网络很少会被应用于较为复杂的场景中 。 常规神经网络一般用于依赖所有特征的简单场景 , 比如说房价预测模型和在线广告推荐模型使用的都是相对标准的全连接神经网络 。 FC组成的常规神经网络的具体形式如图2-7所示 。
文章插图
▲图2-7 FC组成的常规神经网络
02 卷积神经网络卷积神经网络(CNN)是一种专门用来处理具有类似网格结构的数据的神经网络 , 如图像数据(可以看作二维的像素网格) 。 与FC不同的地方在于 , CNN的上下层神经元并不都能直接连接 , 而是通过“卷积核”作为中介 , 通过“核”的共享大大减少了隐藏层的参数 。
简单的CNN是一系列层 , 并且每个层都通过一个可微函数将一个量转化为另一个量 , 这些层主要包括卷积层(Convolutional Layer)、池化层(Pooling Layer)和全连接层(FC Layer) 。
卷积网络在诸多应用领域都有很好的应用效果 , 特别是在大型图像处理的场景中表现得格外出色 。 图2-8展示了CNN的结构形式 , 一个神经元以三维排列组成卷积神经网络(宽度、高度和深度) , 如其中一个层展示的那样 , CNN的每一层都将3D的输入量转化成3D的输出量 。
文章插图
▲图2-8 CNN的结构形式
03 循环神经网络循环神经网络(RNN)也是常用的深度学习模型之一(如图2-9所示) , 就像CNN是专门用于处理网格化数据(如一个图像)的神经网络 , RNN是一种用于处理序列数据的神经网络 。
如音频中含有时间成分 , 因此音频可以被表示为一维时间序列;语言中的单词都是逐个出现的 , 因此语言的表示方式也是序列数据 。 RNN在机器翻译、语音识别等领域中均有非常好的表现 。
文章插图
▲图2-9 简单的RNN结构
关于作者:刘祥龙 , 副教授 , 博士生导师 , 现任职于北京航空航天大学软件开发环境国家重点实验室 , 主要研究大数据检索、大规模视觉分析、可信赖深度学习等 。
杨晴虹 , 博士 , 中科院系列高级工程师 , 北航软件学院人工智能专业主讲教师 , 美国南康涅狄格州立大学图书信息科学访问学者 , 美国耶鲁大学技术创新实验室数据分析专家 。
胡晓光 , 百度杰出研发架构师 , 10余年自然语言处理研发经验 , 参与的机器翻译项目获得国家科技进步二等奖 , 现负责飞桨核心训练框架和模型算法的研发 , 致力于打造最好用的深度学习平台 。
推荐阅读
- 原来这3种常见的充电方式,会导致手机电池续航变差!望相互转告
- 手机能用多久?如果出现这3种征兆,说明“默认使用时间”已到
- 支付宝发布新规,用户如果出现这3种情况,花呗或将直接封停
- 原来华为手机隐藏扫描仪,3种方法,纸质档几秒电子化,一学就会
- 手机偷看“不良网站”后,如果出现这3种现象,你可能已被监听
- 整理:常见的Java开发框架有哪些,看过,就赶紧收藏吧
- 手机里的这3种“照片”,请尽快删除清空回收站,望周知
- 锁专题(1)java 常见锁介绍,高级程序员必知必会
- 常用手机看不良网站,会出现3种“怪症状”!网友:后悔知道晚了
- OPPO x 故宫:一次不加价的用心联名