产业气象站 机器学习项目必备:端到端机器学习项目开发过程的任务表( 二 )


·每个模型部署N折交叉验证(N-foldcross-validation) , 并计算N个折叠上性能指标的平均值和标准差 。
·研究对目标影响最大的特征 。
·分析模型在预测时出错的类型 。
·以不同的方式设计特征 。
·多次重复上述步骤(反复试验) , 确保以正确的格式使用正确的特征 。
·基于性能衡量标准列出最佳模型 。
6.微调入围模型 , 检查集成方法
这是关键步骤之一 , 在此步骤中将更接近最终解决方案 。 主要步骤应包括:
·使用交叉验证进行超参数调整 。
·使用自动调整方法 , 如随机搜索或网格搜索 , 为最佳模型找到最佳配置 。
·测试集成方法 , 如投票分类器等 。
·用尽可能多的数据测试模型 。
·完成后 , 使用一开始抛之一侧的测试样本 , 来检查是否过拟合或欠拟合 。
7.记录代码并传达解决方案
沟通的过程是多方面的 , 请时刻牢记所有现有的和潜在的利益相关者 。 主要步骤包括:
·记录代码以及整个项目的完成方法和过程 。
·创建一个简明的仪板或一个具有深刻见解的演示文稿 , 其应具有接近自我解释的可视化效果 。
·撰写博客/报告 , 记录如何分析特征、测试不同的转换等 , 记录学习成果(失败和有效的技巧) 。
·总结主要成果和未来蓝图(如有) 。
8.在生产中部署模型和监视器
如果项目需要在实时数据上测试部署 , 应该创建一个web应用程序或RESTAPI , 以便在所有平台(web、android、iOS)上使用 。 主要步骤(因项目而异)包括:
·将最终训练的模型保存到h5或pickle文件中 。
·使用web服务为模型服务 , 可以使用Flask开发这些web服务 。
·连接输入数据源并设置ETL管道 。
·使用pipenv、docker/Kubernetes(基于扩展需求)管理依赖关系 。
·可以使用AWS、Azure或Google云平台来部署服务 。
·监控实时数据的性能 , 或让人们将你的模型与他们的数据一起使用 。
产业气象站 机器学习项目必备:端到端机器学习项目开发过程的任务表
文章图片
图源:unsplash
不要照本宣科 , 你的检查表可以根据项目的复杂性进行调整 。 以此为基础 , 一个完美的机器学习项目正向你招手 。
留言点赞关注
我们一起分享AI学习与发展的干货
如转载 , 请后台留言 , 遵守转载规范
【来源:读芯术】
【产业气象站 机器学习项目必备:端到端机器学习项目开发过程的任务表】声明:转载此文是出于传递更多信息之目的 。 若有来源标注错误或侵犯了您的合法权益 , 请作者持权属证明与本网联系 , 我们将及时更正、删除 , 谢谢 。 邮箱地址:newmedia@xxcb.cn


推荐阅读