轻松掌握MLOps的操作指南( 二 ) _MLOps

接下来，考虑什么解决方案最能解决这个问题。你需要机器学习来解决这个问题，还是可以从简单的启发式方法开始来处理欺诈？所有的欺诈是否都来自一小部分IP地址？
如果你决定构建一个机器学习模型（假设这个案例是监督学习），你将需要标签和特征。你将如何处理缺失的变量？异常值呢？欺诈标签的观察窗口是多少？即用户报告欺诈交易需要多长时间？是否有一个数据仓库可以用来构建特征？在向前移动之前，确保验证数据和特征。这也是与利益相关者就项目方向进行交流的好时机。
一旦你有了所需的数据，就构建模型并进行必要的分析。确保模型指标与业务使用相符。（例如：对于这个用例，可能是第一分位数的召回率）。所选的模型算法是否满足延迟要求？
最后，与工程协调部署和服务模型。因为欺诈检测是一个非常动态的环境，欺诈者努力保持在系统前面，所以监控非常重要。对数据和模型都有一个监控计划。例如，人口稳定性指数（PSI）是常用的跟踪数据漂移的措施。你将多久重新训练一次模型？
现在，你可以成功地通过使用机器学习（如果需要的话！）来减少欺诈交易，从而创造商业价值。
结论希望在阅读这篇文章后，你能够理解MLOps给企业实现机器学习到部署带来的益处。总的来说，MLOps能够给数据科学团队带来如下优势：

解决正确的业务问题
使用正确的工具来解决问题
利用代表问题的数据集
构建最优的机器学习模型
最后部署和监控模型以确保持续的成功

然而，要注意常见的陷阱，以确保你的数据科学项目不会成为数据科学墓地的一块墓碑！数据科学应用是一个活生生的东西。数据和模型需要持续被监控。从一开始就应该考虑AI治理，而不是作为事后的想法。牢记这些原则，我相信你可以真正地利用机器学习（如果需要的话！）创造商业价值。
译者介绍崔皓，51CTO社区编辑，资深架构师，拥有18年的软件开发和架构经验，10年分布式架构经验。
原文标题：How to MLOps like a Boss: A Guide to machine Learning without Tears，作者：Natesh Babu Arunachalam

【轻松掌握MLOps的操作指南】