技术编程机器学习之Hyperparameter Tuning |AI人工智能|

机器学习时模型训练非常简单，将数据分成训练集（training set）和测试集（testing set），用training set训练模型，然后将模型应用到testing set上评估模型的好坏。
怎么优化模型，使得模型更加稳定有效呢？
方法是超参数优化（Hyperparameter tuning）。比如我们有3个hyperparameter ，每个Hyperparameter可以设置3个数值，这样我们就可以得到3X3X3=27个组合，然后用相同的训练集分别训练27个模型，将这27个模型分别应用在testing set上，就可以比较出那组Hyperparameter组合比较好。
但是，当我们把模型应用到真实场景的时候，往往会发现模型效果比在testing set上差很多。为什么会出现这样的问题呢？原因是我们调整参数的时候都是用的一套testing set ，所以我们选择的参数只是适应这个特殊的数据集。这时候validation set就该上场了！
这次数据就不能只分为训练集和测试集了，而是在训练集和测试集之外再分出验证集（validation set）。在Hyperparameter tuning时将训练的模型应用到validation set上挑选出最好的Hyperparameter 组合，然后将最好组合的模型应用到testing set上，得到模型的最终效果。
这时候另外一个问题出现了，由于我们这次将模型应用在一个固定validation set上，而validation set 有可能太大或者太小，这次得到的模型很有可能不是模型的最优解，怎么办呢？我们可以用k fold cross validation来解决这个问题。如下图，首先将数据分为训练集和测试集，训练集再分为k份（例子中是5份），模型训练的时候用其中的k-1份作为训练集，用剩下的一份数据作为验证集，这样训练k个模型，将k次建模结果的平均数作为这个Hyperparameter组合的最终结果，这样得到模型的最优解。

本文插图
【技术编程机器学习之Hyperparameter Tuning】

技术编程机器学习之Hyperparameter Tuning

推荐阅读

炖黑鱼汤时，这1点需要牢记，做错了，鱼腥味重汤寡淡，还没营养

冰点还原精灵卸载、冰点还原精灵怎么卸载?

孩子上课睡觉家长该怎么教育孩子

『双面性格的双鱼』为人处事尽显不凡，更容易从中取得成功，最具有大格局的3个星座

溜了溜了是什么梗

日本|引人遐想！日本晚上住酒店，为何会有美女常来？游客：无奈

在北京都有哪些心酸的经历

为啥知乎里人都是回答一大推，提问却很少呢

喜欢|被美国拉入“黑名单”的4种菜，中国人却很喜欢，网友我天天吃

湖南卫视|《湖南卫视》金鹰节拉开序幕，时间暂定11月，嘉宾阵容有肖战

重点|动力煤价格持续上涨，机构重点推荐2条投资主线

普洱如何醒茶

二手车|收购价甚至超过购买价二手车为何如此火爆？

除了头孢，吃了这7类药物后饮酒也会致命！越早知道越好

小霞谈趣事|天生没有安全感，非常在乎丈夫的眼光，“最不敢离婚”的3生肖女

淮府琥灵效果怎么样,淮府琥灵多少钱一瓶

宝马5系@2020款宝马530Li 尊享型豪华套装特价出售

汽车资讯天地|智慧城市华为云又下一城！千万大单拿下仓山人工智能云服务

小武爱生活韩国街头的海豚面包，做法类似鲷鱼烧，但是味道比它香太多了

曹飞飞|雍正都被人刺杀过，为何朱元璋杀人无数，却没人敢刺杀？，秦始皇