技术编程,AI人工智能|机器学习之Hyperparameter Tuning 技术编程|AI人工

【技术编程,AI人工智能|机器学习之Hyperparameter Tuning】机器学习时模型训练非常简单，将数据分成训练集（training set）和测试集（testing set），用training set训练模型，然后将模型应用到testing set上评估模型的好坏。
怎么优化模型，使得模型更加稳定有效呢？
方法是超参数优化（Hyperparameter tuning）。比如我们有3个hyperparameter ，每个Hyperparameter可以设置3个数值，这样我们就可以得到3X3X3=27个组合，然后用相同的训练集分别训练27个模型，将这27个模型分别应用在testing set上，就可以比较出那组Hyperparameter组合比较好。
但是，当我们把模型应用到真实场景的时候，往往会发现模型效果比在testing set上差很多。为什么会出现这样的问题呢？原因是我们调整参数的时候都是用的一套testing set ，所以我们选择的参数只是适应这个特殊的数据集。这时候validation set就该上场了！
这次数据就不能只分为训练集和测试集了，而是在训练集和测试集之外再分出验证集（validation set）。在Hyperparameter tuning时将训练的模型应用到validation set上挑选出最好的Hyperparameter 组合，然后将最好组合的模型应用到testing set上，得到模型的最终效果。
这时候另外一个问题出现了，由于我们这次将模型应用在一个固定validation set上，而validation set 有可能太大或者太小，这次得到的模型很有可能不是模型的最优解，怎么办呢？我们可以用k fold cross validation来解决这个问题。如下图，首先将数据分为训练集和测试集，训练集再分为k份（例子中是5份），模型训练的时候用其中的k-1份作为训练集，用剩下的一份数据作为验证集，这样训练k个模型，将k次建模结果的平均数作为这个Hyperparameter组合的最终结果，这样得到模型的最优解。

文章图片

文章图片

技术编程,AI人工智能|机器学习之Hyperparameter Tuning

推荐阅读

历史|美股三连跌科技股领跌大盘

[数码小王]Pro有点像，还是双打孔曲面屏！荣耀30 Pro真机曝光，跟华为P40

海外网|8月30日全球疫情观察：至少16国日增确诊超千例印度单日确诊再现最大增幅

熟普洱的保存方法熟普洱保存和储藏方法

默叔说香水|库尔吉安乌木丝缎心情教科书式乌木玫瑰香

如何自己办理宠物托运宠物托运手续

天猫店新店考核不通过天猫店考核期指标没有达到怎么办

『车家号』95 km，加量不加价的宝马530Le增重后如何延续操控，纯电续航升至

中国新闻网|浙江龙泉发现国家二级保护动物阳彩臂金龟

公新翰@但最伤的是另一个决策！，QG四连跪的主要原因找到？没买最初很伤

黑喵游妮|阴阳师8月19日体验服更新总结为崽而战斗技中午时长变成2小时

生煎包|松江超嗲的生煎包大全，哪家是你最爱吃的？

宝宝躺着吃奶(躺着给宝宝喂奶好么？)

之夏|博山自闭症疗育中心获第四届“博山之夏”全民才艺大赛“特殊表演奖”

咽喉干燥可喝西洋参麦冬茶

大洋网|海关归类服务为企业年减关税逾千万元

女性冬季如何饮食养生？几款专属女性的养生食物

前无后有|工资太低而消费太低，该怎么办？，职场中的年轻人

提亮嫩肤秘方大公开，教你一键美白上岸

首席生活家开箱体验，智能方便：美的嵌入式蒸烤一体机BS5055W