基于密集行为的欺诈检测算法-LockInfer

作者:小伍哥
来源:小伍哥聊风控

基于密集行为的欺诈检测算法-LockInfer

文章插图
 
大家好 , 我是小伍哥 , 今天给大家分享的是一个基于密度的欺诈检测算法 , 思想非常牛逼 , 大家可以试试 , 先给出论文地址和代码
论文地址:http://pengcui.thumedialab.com/papers/lockinfer-kais15.pdf
代码地址:https://github.com/mjiang89/LockInfer
一、LockInfer算法概述互联网上泛滥着形形色色的欺诈行为 , 特别是社交网络诞生以来 , 许多职业黑客和黑色产业链便通过欺诈行为谋生 , 淘宝的刷单、微博刷粉、抖音刷赞等都成了众所周知的事情 。这种拥有批量账户为用户提供作弊的行为 , 叫做lockstep行为 , 如何检测这些作弊用户 , 成为一个非常大的课题 。
给定社交网络、专利引用网络和电话网络等多种大规模应用的网络拓扑结构 , 如何能抓住可疑的用户行为?
如何能找到惊人的、难以预知的连接模式?有很多工作已经研究了通信商的欺诈行为、Ebay 中的虚假评价和 Facebook 上虚假的页面 “喜欢” , 而这里所研究的是常见的异常行为模式 , 并尝试开发一种通用的有效方法从不同的应用中检测出这类行为 , 一种基于密集行为的检测方法 。
1、密集行为的案例在这里我们先展示出密集行为的三个案例 :
a) 在Facebook或是Twitter 的类似的可以被表示为无向图/有向图的社交网络中 , 许多售粉公司都设置了百万级的僵尸粉一起行动 , 共同关注同一群人(顾客)来提升他们的市场价值 。所以 , 虽然这些 被关注的人并不知名 , 但是他们会最终有很多粉丝 。这些粉丝是花钱雇佣来的 , 或者是用脚本创造出来的 。这种密集行为会在图对应的邻接矩阵中形成大的、密集的块 。
基于密集行为的欺诈检测算法-LockInfer

文章插图
 
b) 在论文引用的网络中 , 在同一个研究问题或者是同一个项目里的研究 者们往往会互相引用对方的文章 , 即使这些文章与他们的工作毫不相关 。
基于密集行为的欺诈检测算法-LockInfer

文章插图
 
c) 在诸 如IMDb , MovieLens和Netflix 等电影参演的网络中 , 男演员/女演员/导演经常与关系已经很好的朋友一起合作参演电影 , 这样会更容易在工作中交流 , 更容易理解电影中演员的形象 。这些网络是可以用二部图来描述的 。要注意的是密集行为是说一组演员/导演与一组电影之间的交互 , 并最终在理解矩阵里面形成个密集子矩阵(块状) 。
基于密集行为的欺诈检测算法-LockInfer

文章插图
 
2、低密度密集连接在基于图的应用中 , 密集行为模式是非常常见的 , 所以一个很重要又很有趣的问题是:如何来找到几乎满员的密集块状子矩阵 , 也就是如何找到密集行为的链接?
这个问题做起来并不那么容易 , 就社交网络为例 , 其中有很多帮助顾客提粉丝数的僵尸粉公司存在 , 这类行为扭曲社交媒体的网络结果 , 导致正常用户体验受到严重伤害 , 僵尸粉公司会开发出各种办法来绕开检测 , 一种方法是形成密度较低的块 。
基于密集行为的欺诈检测算法-LockInfer

文章插图
 
比如上图(a) 中就提出了一个更难的问题:如何检测到密集却不是100% 密集的块状结构?
什么情况下一个块过于大过于密集 , 以至于在图中很难出现?
图(b) 中给出了多组僵尸粉与顾客相连接的案例 , 僵尸粉群往往很分享顾客 , 而他们形成的密集行为会产生部分重合 , 如何检测部分重合的密集行为?
二、密集行为的类型近年来的一些研究把社交图数据转为连接模式来研究社区结构以及聚类属性 。然而 , 并没有任何分析能够指出如何检测出特殊行为的方式方法 。本文在腾讯微博的完整有向图数据上做研究 。这份数据是 2011年1月爬取得 到 , 含有1.17亿的用户和33.3亿的社交关系 。在微博图中研究用户的关注行为时讨论了不同种类的密集行为 。
基于密集行为的欺诈检测算法-LockInfer


推荐阅读