江湖车侠|| 万字长文,统计学家范剑青:把 AI 学习金融,变为现实( 七 )


从2012年10月到2014年十月 , 在外汇交易中 , 80%的交易量是算法交易 , 其中多半是高频交易 。 所以高频交易显然是把大数据带到金融世界里 。
那么 , 自然而然需要问 , 什么是可以预测 , Momentums可以预测还是Durations可以预测?那么 , 什么是有用的预测因素呢?我们要往后看多久?现在机器学习的方法有没有任何优势?
第一次 , 这两个点同时往上或往下走1-tick , 对这个例子来说正好是负的 , 我们就定义
。 如果我们继续等待这两个点同时往上或往下走2-tick时 , 这两个点同时往上走 , 是正的 , 也就是

简单来说 , 我们的Momentum是站在现在的时刻(也即是t) , +1表示往上 , -1表示往下 。 在中间的交易量 , t到t'之间称为duration 。 1-tick的Duration表示的是当前时刻t到下一个同时往上或者往下走1-tick的时刻t'之间的交易量 , 用
表示 , Duration
同理 。
和最佳卖出价
, 和它们相应的买入量
和卖出量
, 一共7个变量 。 如果往后看L步 , 那就是7乘L 。
为了简单起见 , 我用
表示
(最佳买入价格)和
(最佳卖出价格) ,
表示
(最佳买入量)和
(最佳卖出量) , 上述这些都是原始数据 。
另一方面 , 是专家构造的预测因子 , 由于定义比较复杂 , 公式我没有写出来 , 例如OrderBookImbalance和OrderFlowImbalance 。 上述全部就是我们构造的变量 。


推荐阅读