神经网络为何越大越好？NeurIPS论文证明：鲁棒性是泛化的基础( 二 ) _神经网络

要想理解这一点，可以再次想象平面上的一条曲线，其中x坐标代表一个像素的颜色，y坐标代表一个图像标签。

由于曲线是平滑的，如果你稍微修改一下像素的颜色，沿着曲线移动一小段距离，相应的预测值只会有少量的变化。另一方面，对于一条锯齿状的曲线，X坐标（颜色）的微小变化会导致Y坐标（图像标签）的巨大变化，长颈鹿可以变成沙鼠。

Bubeck和Sellke在论文中证明，平滑拟合高维数据点不仅需要n个参数，而且需要n×d个参数，其中d是输入的维度（例如，784个像素的图像输入维度为784）。

换句话说，如果你想让一个网络稳健地记住它的训练数据，过度参数化不仅是有帮助的，而且是必须的。该证明依赖于一个关于高维几何的事实，即随机分布在球体表面的点几乎都是彼此相距一个直径的距离，点与点之间的巨大间隔意味着用一条光滑的曲线来拟合它们需要许多额外的参数。

文章插图

耶鲁大学的Amin Karbasi称赞论文中的证明是非常简洁的，没有大量的数学公式，而且它说的是非常通用的内容。

这一证明结果也为理解为什么扩大神经网络的简单策略如此有效提供了一个新的途径。

其他研究揭示了过量参数化有帮助的其他原因。例如，它可以提高训练过程的效率，也可以提高网络的泛化能力。

虽然我们现在知道过量参数化对鲁棒性是必要的，但还不清楚鲁棒性对其他事情有多大必要。但通过将其与过度参数化联系起来，新的证明暗示鲁棒性可能比人们想象的更重要，这也可能为其他解释大模型的益处研究做铺垫。

鲁棒性确实是泛化的一个先决条件，如果你建立了一个系统，只是轻微地扰动它，然后它就失控了，那是什么样的系统？显然是不合理的。

所以，Bubeck认为这是一个非常基础和基本的要求。

参考资料：
https://www.quantamagazine.org/computer-scientists-prove-why-bigger-neural-networks-do-better-20220210/

神经网络为何越大越好？NeurIPS论文证明：鲁棒性是泛化的基础( 二 )

推荐阅读

「日本」日本捡了个大便宜！俄罗斯取消对华订单，日本趁机拿下150亿大单

《与凤行》为何符生会止水术？行止没想到，自己早就被算计了

网文|网文圈吃瓜精选20期

明星素颜|难怪宁静说洗了脸都是黄脸婆，看到“浪姐”素颜差距也太大了吧

北京日报客户端|大连：对两个中风险地区全面封闭、全面消杀

特朗普|特朗普指责民主党人阻止延续失业救助金计划，果然又顺嘴甩锅中国

海峡军志|射程180千米，中国反舰导弹来到美国家门口！委内瑞拉采购C-802A

白羊座@【12星座心理测验】从爱情观测出和你命中注定的恋人星座！

switch|真有你的老任! FC经典作品《火焰纹章》限时登陆NS

比亚迪2020全年销量约42万辆同比下滑7.46%

买房的流程购房流程图

|开关插座从8块到100块都有，5分钟让您知道选购攻略，超实用

做韭菜盒子的面怎么和韭菜盒子烫面好还是正常和面

禁毒|禁毒进乡村宣传促提高

马客说历史|宋朝时期的一位不败战神,在场战役中一战成名

张丹峰|洪欣懒理婚变传闻与女儿跳舞身材纤细长腿抢镜

Auto实验室|奥德赛跌至19.5万，配魔术门，还买啥别克GL8，本田拿出诚意

常吹水的阿诚|优化史诗三选一，错过电玩小子悔哭，没特工的巨赚，碎片商店更新

818体育资讯■小贝1.75亿买迈阿密顶层公寓!楼顶配直升机坪,5卧室一家6口正合适

招聘|研究生笔试第一，还是上岸失败，导师揭露其内幕