产业气象站|AI加持下的互联网反欺诈|反欺诈AI全域治理三部曲( 二 )


另一类是深度学习+时间序列检测算法 , 常用的LSTM模型来拟合周期型的时间序列 , 或利用自编码器的重构误差和局部误差 , 输入数据是归一化之后的原始数据(normalizedrawdata) , 输出的是两个标签(正常&amp异常) 。
?优点:可以实现端到端(EndtoEnd)的训练过程 , 有效拟合用户行为规律 。 ?缺点:维护模型的成本比较高 , 不太适用于大规模的时间序列异常检测场景 , 周期型的曲线效果比较好 , 如果是毛刺型的数据有可能就不太适用 。
关联图谱
图数据是一种更加广泛的数据表示方式 , 夸张地说 , 没有任何一个场景中的数据彼此之间是孤立存在的 , 这些数据之间的关系都可以图的形式进行表达 。 最近一年 , GNN的应用场景不断延伸 , 覆盖了计算机视觉、3D视觉、自然语言处理、科研、知识图谱、推荐、反欺诈等场景 。
关系数据的挖掘是绝大部分反欺诈业务开展最重要的技术视角 , 不论是基于欺诈风险传播的关联分析还是基于黑产团伙模式的结构化挖掘 , 图都是反欺诈业务人员的首选工具 。 在这样的背景下 , GNN也变得极有发挥空间 。 例如 , GNN对支付宝欺诈用户进行识别检测 , GNN对咸鱼上的评论进行欺诈识别 。
场景化团伙欺诈场景 , 引入关联图谱关系定义 , 通过共用、共享、连接指向等关系定义 , 构建基于不同资源维度的复杂关系图谱 , 如账号图谱、设备图谱、电话号码图谱等 。 引入图论领域出入度、中心度、模块度、最短链路、Riskrank、顶点嵌入、图卷积等图算法 , 对大部分团伙欺诈场景有很好的适用性 。
?优点:通过部署一个模型可以应对多个场景的团伙性欺诈挖掘 , 项目部署实施成本低 , 运维成本低等 。 ?缺点:相对于独立的场景化团伙欺诈检测 , 模型召回率在可接受范围内有一定损失 。
02、历史欺诈案件深度挖掘应用
项目上线一段时间后 , 原始案件数据有一定沉淀积累 , 这个阶段面临的问题是如何更好地从已有沉淀案件中深度挖掘隐藏的欺诈模式 , 提供在线实时预测服务 。 深度欺诈检测常用算法列表有XGBoost、DeepFFM、XDeepFM、Wide&ampDeep、DIN等以及算法融合 。 有监督学习模型在发现历史案件中蕴含的欺诈模式方面相对于专家经验有如下5个方面的优势:
?发现深度复杂隐式欺诈特征 , 这点对比专家规则 , 具有较强针对性;
?发现的规则是非线性的 , 对事后分析绕过对抗有较强的免疫力;
?具有正反双向作用力 , 对比专家规则单向作用模型 , 正反双向作用性质 , 可以对模型过拟合风险起到很好对冲作用;
?通过深度网络多层交叉组合 , 一方面进一步加强规则集对抗性、持续性 , 另一方面提升模型泛化能力、增强欺诈场景的普适性;
?做到在线实时风评防控 , 提升模型风控时效性 , 从事后分析前置到事中实时防控 , 通过一个模型可以覆盖全渠道场景欺诈类型检测 , 真正做到OneModelRuleAll 。 缺点是相对专家规则模型单规则理解性差 , 算法复杂度高 。
当然 , 要正确理解机器学习模型作用和功能 , 需要模型相关的业务人员、技术运营人员建立模型治理理念和认知 , 从单规则角度转变为模型整体防控角度来更好更全面理解模型效果 。 从检出率 , 误报率 , 漏报率 , 准确率等全局性指标中 , 分析研判模型整体效果和趋势 。
【来源:安全牛】
【产业气象站|AI加持下的互联网反欺诈|反欺诈AI全域治理三部曲】声明:转载此文是出于传递更多信息之目的 。 若有来源标注错误或侵犯了您的合法权益 , 请作者持权属证明与本网联系 , 我们将及时更正、删除 , 谢谢 。 邮箱地址:newmedia@xxcb.cn


推荐阅读