接下来,考虑什么解决方案最能解决这个问题 。你需要机器学习来解决这个问题,还是可以从简单的启发式方法开始来处理欺诈?所有的欺诈是否都来自一小部分IP地址?
如果你决定构建一个机器学习模型(假设这个案例是监督学习),你将需要标签和特征 。你将如何处理缺失的变量?异常值呢?欺诈标签的观察窗口是多少?即用户报告欺诈交易需要多长时间?是否有一个数据仓库可以用来构建特征?在向前移动之前,确保验证数据和特征 。这也是与利益相关者就项目方向进行交流的好时机 。
一旦你有了所需的数据,就构建模型并进行必要的分析 。确保模型指标与业务使用相符 。(例如:对于这个用例,可能是第一分位数的召回率) 。所选的模型算法是否满足延迟要求?
最后,与工程协调部署和服务模型 。因为欺诈检测是一个非常动态的环境,欺诈者努力保持在系统前面,所以监控非常重要 。对数据和模型都有一个监控计划 。例如,人口稳定性指数(PSI)是常用的跟踪数据漂移的措施 。你将多久重新训练一次模型?
现在,你可以成功地通过使用机器学习(如果需要的话!)来减少欺诈交易,从而创造商业价值 。
结论希望在阅读这篇文章后,你能够理解MLOps给企业实现机器学习到部署带来的益处 。总的来说,MLOps能够给数据科学团队带来如下优势:
- 解决正确的业务问题
- 使用正确的工具来解决问题
- 利用代表问题的数据集
- 构建最优的机器学习模型
- 最后部署和监控模型以确保持续的成功
译者介绍崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验 。
原文标题:How to MLOps like a Boss: A Guide to machine Learning without Tears,作者:Natesh Babu Arunachalam
【轻松掌握MLOps的操作指南】
推荐阅读
- 职业赛场变幻?职称晋升之道助你轻松应对新挑战!
- 掌握这些命令,轻松查看Linux日志文件
- 掌握Scrapy框架,轻松实现网页自动化爬取
- 掌握API数据检索:过滤和排序的综合指南
- 网红瓜妈宣布离婚,直言从来没这么轻松过,自爆两个继女前期挑拨
- 无需汗水狂飙!这个简单活动让你轻松拥有好身材!
- 掌握这10个跑步技巧,让你成为跑步达人!
- 马赛克效果怎么做?视频编辑技巧轻松get
- 快速批量剪辑视频,轻松制作专业片头片尾!
- 五步让你掌握Python数据结构