数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘( 二 )


数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图

数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图
【数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘】
?
数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图

2.2 基于贝叶斯隐马尔可夫的市场状态建模方法
前面介绍了互联网金融市场融资动态预测研究;然而 , 如何根据市场动态观察变量挖掘和建模隐含的市场状态(例如火爆、冷门) , 还缺少相应的研究 。 事实上 , 由于在线金融市场的波动性和流动性非常高 , 识别市场状态是非常必要的 。 本研究通过在不同假设下扩展贝叶斯隐马尔可夫模型专门研究了网络借贷中市场状态建模 问题 。 具体来说 , 首先使用马尔可夫链结构来模拟市场状态的动态和顺序特征 。 在这里 , 假设借款产品市场状态受其自身属性影响 , 当前状态仅由其先前一个状态决定 。 基于此假设 , 本文提出 了建模市场状态的L-BHMM(Listing-Bayesian Hidden Markov Model)模型 。 但是 , 现实调查 结果表明 , 市场状况可能同时会受到市场形势的影响 。 因此 , 本文进一步设计了更全面的模型LM- BHMM(Listing and Market-Bayesian Hidden Markov Model) 。 L-BHMM和LM-BHMM 都可 以连接借款产品的隐藏市场状态和出借人的投标行为 。
为了评估研究中所提出的方法 , 在Prosper 数据集上进行了实验 , 其结果充分地说明了所设计模型在市场状态建模及其相关应用任务上的有效性 。
3 面向交易和离场行为的联合生存分析
互联网金融用户的流动性非常大 , 特别是在基于捐赠类众筹中 , 由于平台非营利性 , 用户流失(离场行为)问题更加严重 。 分析影响用户流失的原因 , 进而预测用户流失 , 是平台管理中非常重要的内容 。 研究中具体形式化重复捐赠交易和捐赠者保留两个协同预测任务 。 该研究具体目的在于预测捐赠者未来每个时间段是否会进行捐赠交易 , 以及捐赠者到未来某个时间是否仍然活跃在该平台上 。 事实上 , 捐赠者保留问题可以用生存分析技术解决 。 然而 , 传统的生存分析模型 擅长处理变量之间的线性关系 。 为了建模捐赠者保留问题中复杂的变量关系并且充分利用异构的特征 , 本文提出了联合深度生存模型(JDS)来 联合学习两个协同任务 。 如图4所示 , JDS 主要包含输入组件(Input)、表示组件(Representation) 和预测组件(Prediction)三个组件 。 具体地 , 输 入组件负责初步地提取所有的异构特征;表示组件用来进一步学习每个特征向量表示;预测组件分别给出在两个任务上的结果 。

数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图

?
数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图

?
数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图

?
数据挖掘@AI研习丨优秀博士学位论文:面向互联网金融微观对象的数据挖掘
本文插图

捐赠者的重复捐赠行为与他在平台上的去留高度相关;另外 , JDS模型的两层预测输出共享相同的特征输入和表示 。 因此 , 两个目标上的优化方向一定程度上是一致的 。 受到这些特点启发 , 本文开发了交替优化算法在两任务上联合训练JDS模型 。
为了评估研究中所提出的方法 , 在众筹平台Kiva数据集上进行了分析和实验 , 其结果显著地表明了所提出方法在分析和预测重复捐赠交易行为和客户保留问题上的有效性 。


推荐阅读