轻松掌握MLOps的操作指南( 二 )


接下来,考虑什么解决方案最能解决这个问题 。你需要机器学习来解决这个问题,还是可以从简单的启发式方法开始来处理欺诈?所有的欺诈是否都来自一小部分IP地址?
如果你决定构建一个机器学习模型(假设这个案例是监督学习),你将需要标签和特征 。你将如何处理缺失的变量?异常值呢?欺诈标签的观察窗口是多少?即用户报告欺诈交易需要多长时间?是否有一个数据仓库可以用来构建特征?在向前移动之前,确保验证数据和特征 。这也是与利益相关者就项目方向进行交流的好时机 。
一旦你有了所需的数据,就构建模型并进行必要的分析 。确保模型指标与业务使用相符 。(例如:对于这个用例,可能是第一分位数的召回率) 。所选的模型算法是否满足延迟要求?
最后,与工程协调部署和服务模型 。因为欺诈检测是一个非常动态的环境,欺诈者努力保持在系统前面,所以监控非常重要 。对数据和模型都有一个监控计划 。例如,人口稳定性指数(PSI)是常用的跟踪数据漂移的措施 。你将多久重新训练一次模型?
现在,你可以成功地通过使用机器学习(如果需要的话!)来减少欺诈交易,从而创造商业价值 。
结论希望在阅读这篇文章后,你能够理解MLOps给企业实现机器学习到部署带来的益处 。总的来说,MLOps能够给数据科学团队带来如下优势:

  • 解决正确的业务问题
  • 使用正确的工具来解决问题
  • 利用代表问题的数据集
  • 构建最优的机器学习模型
  • 最后部署和监控模型以确保持续的成功
然而,要注意常见的陷阱,以确保你的数据科学项目不会成为数据科学墓地的一块墓碑!数据科学应用是一个活生生的东西 。数据和模型需要持续被监控 。从一开始就应该考虑AI治理,而不是作为事后的想法 。牢记这些原则,我相信你可以真正地利用机器学习(如果需要的话!)创造商业价值 。
译者介绍崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验 。
原文标题:How to MLOps like a Boss: A Guide to machine Learning without Tears,作者:Natesh Babu Arunachalam

【轻松掌握MLOps的操作指南】


推荐阅读