江湖车侠|| 万字长文,统计学家范剑青:把 AI 学习金融,变为现实

2020年8月7日-9日 , 第五届CCF-GAIR全球人工智能与机器人峰会 , 于深圳隆重举办 。
此次峰会由中国计算机学会主办 , 雷锋网、香港中文大学(深圳)联合承办 , 鹏城实验室、深圳市人工智能与机器人研究院协办 。
在大会第三日的「AI金融专场」中 , 著名统计学家、普林斯顿大学金融讲座教授范剑青 , 从大数据与人工智能、稳健因子学习及其应用、债券风险溢价预测、高频交易预测、文本分析与金融投资 , 这五大板块 , 向与会者报告近些年他的研究团队的部分工作成果 。
范剑青是国际数理统计学会创办70年以来第一位华人主席 , 也是统计旗舰杂志《统计年鉴》的第一位华人主编 , 论文引用数多年位列世界数学家前十名 , 是素有统计学诺贝尔奖之称的CPOSS总统奖得主 , 也是《概率及其相关领域》、《计量经济》、《商务统计》等五个国际顶尖学术期刊的主编 。
他指出 , 大数据=系统+分析+应用 , 机器学习=统计+优化+实现环境 。
如今深度学习之所以能如此成功 , 范剑青认为它是权衡偏差和方差的有效方法 , 深度网络使高维函数更加灵活 , 大数据降低了统计方差 , 而现在计算技术使大数据深度学习得到有效的实现 。
范剑青认为 , 在经济金融、生物医学、管理决策和人文社会中 , 机器学习有很多挑战和机遇 。 由于个体差异大 , 数据集未知 , 现在发生的事情与几年后的变量完全不一样 , 难以提取特征 , 需要各学科交叉 。 尤其是在金融行业 , 数据不平稳 , 随着时间而变 , 多人参与竞争的市场也是对金融的挑战 。
而机器学习本身就是为降低维数和预测而设计的 , 他认为机器能学习金融 , 尽管金融非常复杂 , 但它的形式是可预测的 。 以股票收益预测为例 , 可以通过高维线性模型、机器学习模型或是深度学习模型来处理 。 他强调 , 成功预测的属性一是大数据 , 二是鲁棒 , 三是模型具备市场的重要特征 。
他还详尽地用几个例子来说明溢价预测相关的问题 , 例如通过市场因子来预测债券风险;并介绍了现阶段可以使用的两种因子学习方法 , 一是传统主成分方法 , 二是利用投影主成分来操作 。
此外 , 范剑青也与现场观众介绍了文本数据如何协助股票投资决策 , 他表示现在可以通过对新闻内容的分析 , 解析文章对股票的褒贬程度 。
最后 , 范剑青总结称 , 资产定价本质上是预测问题 , 机器可以学习金融 。 他认为机器学习可以帮助处理大数据并从中选择重要因素和特征 , 能很好地应对过度拟合的问题 , 允许非线性学习极大地改善预测效果 , 将稳健性和对抗性网络提炼为定价 , 智能预测也会带来很大的经济收益 。
以下是范剑青的大会报告内容 , 雷锋网做了不改变原意的编辑与整理:
非常荣幸能够参加第五届CCF-GAIR全球人工智能与机器人峰会 。 我今天的报告主题是《机器是怎么学习金融的》 。
这次报告的内容 , 是我们金融工程实验室多人的工作成果 , 大纲如下:
大数据与人工智能
稳健因子学习及其应用
债券风险溢价预测
高频交易预测
文本数据与资产定价
重新理解大数据与人工智能众所周知 , 人工智能是由JohnMcCarthy于1955年首次提出 , 一年后 , 他也与多名科学家组织了著名的Dartmouth会议 。
何谓人工智能?
Wikipedia中是这样介绍的:“人工智能”指机器模仿人类的“认知”功能所展示的智能 , 例如“学习”和“解决问题” 。 现实中的人工智能是技术能够训练机器 , 将人从重复性、简单性、危险性的繁琐事务中解除出来 。


推荐阅读