要用神经网络解决一个输入为简单向量的问题,应该怎么样设计网络结构

好像只能划分训练集和验证集,然后不断的试了。不过有一些一般性的技巧了:1)数据的归一化;2)输出是一个值,直接的方法是训练回归模型,L2或者L1损失再或者Huber Loss都可以尝试,不过若尝试将其离散化,然后转为分类问题或许有不错的效果;3)其他的一些如ReLU,Batch Normalization,权值正则,Dropout等。对于该规模的问题,先尝试一下4-1024-1024-1较大的模型,一般来说训练集应该可以较好拟合,然后看看验证集效果,如果不好,可能是过拟合,然后不断减小网络以及采取一些防止过拟合的措施。总之就是不断的试了。


    推荐阅读