[Social Network Analysis] 怎样从邮件发送信息来分析是不是存在不正当行为

从宏观的网络结构上而言,可以通过link prediction去找出一些本来只以小概率存在实际上却有着频繁联系的边,并对这些边进行进一步的研究。仅仅是对于两个人之间的通讯记录而言,可以利用邮件的时间序列进行研究。从05年以Northestern-CCNR的Barabasi组开始用network science的方法研究human dynamics开始,在这方面已经有了比较成熟的结果。典型的结论例如通讯的间隔时间应该服从幂律(power law)的分布。因此,如果通讯间隔时间在一段时间内突然变短(power law fit的结果与其他时间段很不一致),有理由认为这段时间的通讯模式有异常。看见另一个回答的评论也顺手补充一点想法:dynamic network的处理确实还没有一套成熟系统的方法,但这不意味着现有的方法完全没有意义。扯远一点,SNA领域的相关问题,统计学家,物理学家和计算机学家都有所涉猎,但在方法和目标上是有差别的。欢迎拍砖~~计算机学家需要对提出的问题设计快速有效的算法,甚至可以牺牲一定的可解释性。统计学家需要在统计理论下建构出一套相对严谨的体系,例如检测异常可能就需要从统计上假设检验的思路来考虑这个问题。物理学家关心的更多在于现实世界中的网络属性,之前提到的Barabasi组的工作,从BA model开始,基本上都是从empirical的结果出发的工作。会不会有其它的网络不符合这样的规律?当然可能有。但在现实世界中发现一系列真实的反例之前,物理学家的工作对于实际的网络分析仍然有着其独特的作用。因此,从统计学的角度而言,对于这一问题确实还没有建立起一套很成熟的体系。个人认为,network science的大多数问题研究到一定程度之后都非常需要引入统计学的理论加以系统化,但现在看来这一目标的达成可能需要更多的工作。抛开统计学家的身份来看这个问题,现在我们也不完全是无能为力。无论是link prediction的方法或者是power law的拟合,从物理学或者计算机的角度而言,至少是make sense的。这样的分歧也是网络科学作为一个交叉学科目前难以避免的问题吧。


    推荐阅读