为啥感知器要用线性函数,而不用非线性函数,或者神经网络的输入层为啥要用线性函数真心感谢
首先呢,不是perceptron用了线性函数,而是给这个线性函数起了个名字叫perceptron,所以不存在为什么感知器要用线性函数。
【为啥感知器要用线性函数,而不用非线性函数,或者神经网络的输入层为啥要用线性函数真心感谢】
其次,XOR问题是非linearly separable,但这不意味着在同一维度里nonlinear function就能解决XOR问题(实际套了一层activation function的unit已经不是线性的了)。我也想画个圈把对角线圈起来,然而那个圈并不叫函数。引入更高维度的函数可以把它们区分开,但是麻烦。当然可能还有其他的什么办法,有的话请大神们指正。
最经济实惠的操作就是再加一层。这样做的intuition是什么呢?相当于你从更高的维度换了一个视角看问题,数据还是原来的数据,但你看到的是另一个视角的数据,就像正视图,侧视图,你先把物体在三维旋转,然后压扁到平面上。这样转换到另一个space的数据,就可以被下一层用线性函数区分了。
■网友
定义如此,如果用非线性函数就不叫感知器了吧。
这个问题有点像,为啥面积是底边乘以高,而不是底边乘以夹脚为n度的斜边。
■网友
个人观点:第一是要保证模型可导,误差可反向传递。第二模型复杂度,功能性完整的情况下,计算简单。第三,通用性强,比如只需预测一个线性函数,用的模型都是非线性的,学习出来的比较复杂,可能导致overfitting。第四,经验之谈,大家使用的结果证明,这些面对不同的对象,也可以发挥功能。如有不对的地方请指正。
■网友
本来就是要用来拟合复杂函数的,当然越简单越好
■网友
线性是一种美学。相关研究较多,凸,且通常情况下能work。至于异或问题,可以用核映射到另外一个线性可分空间,继续线性分类。对于非线性问题,用线性模型进行局部拟合通常情况下也是可行的。最关键的是,线性,美,凸,研究的多。
■网友
可以用其它非线性函数,但是他们给这种感知器起了别的名字
推荐阅读
- 老钓手果然没吹牛,野钓鲫鱼只要用上这四招,天天去钓都不过瘾
- 为啥看到书柜上的藏书会有心旷神怡的感觉
- 为啥知乎上普便有一种【我在北上广深打工,所以拥有更好的视野】这样的错觉
- 为啥工商银行的用户体验如此之差
- 汽车|看了中消协4S店服务测评调查结果,终于知道法系车为啥卖不好了
- 你为啥从窝窝商城离职?
- 为啥5G和2.4G默认的BSSID是相同的
- 为啥电器实体店的价格比淘宝贵那么多
- 现在在线学习视频有很多了,为啥大部分人还是喜欢下载下来观看
- 为啥到现在你还没有女朋友 ?