时序分析中的常用算法,都在这里了

时序分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征 。这是一类相对比较复杂的预测建模问题,和回归分析模型的预测不同,时间序列模型是依赖于事件发生的先后顺序的 , 同样大小的值改变顺序后输入模型产生的结果是不同的 。

时序分析中的常用算法,都在这里了

文章插图
时序问题都看成是回归问题,只是回归的方式(线性回归、树模型、深度学习等)有一定的区别 。
时序分析包括静态时序分析(STA)和动态时序分析 。
以下为几种常见的时序分析算法1 深度学习时序分析RNN(循环神经网络)【时序分析中的常用算法,都在这里了】循环神经网络是指一个随着时间的推移 , 重复发生的结构 。在自然语言处理(NLP),语音图像等多个领域均有非常广泛的应用 。RNN网络和其他网络最大的不同就在于RNN能够实现某种“记忆功能”,是进行时间序列分析时最好的选择 。如同人类能够凭借自己过往的记忆更好地认识这个世界一样 。RNN也实现了类似于人脑的这一机制,对所处理过的信息留存有一定的记忆,而不像其他类型的神经网络并不能对处理过的信息留存记忆 。
优点:
具有时间记忆功能,适用于解决时间序列中间隔较短的问题;
缺点:
对较远时间步的数据易产生梯度消失、梯度爆炸的问题;
LSTM(长短时记忆网络)长短时记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式 。
优点:
适合于处理和预测时间序列中间隔和延迟非常长的重要事件 。
缺点:
参数量过大、易产生过拟合的问题 。
2 传统的时序分析模型
  • 自回归(Auto Regression, AR)
  • 移动平均线(Moving Average, MA)
  • 自回归移动平均线(Autoregressive Moving Average, ARMA)
  • 自回归综合移动平均线(Autoregressive Integrated Moving Average, ARIMA)
  • 季节性自回归整合移动平均线(Seasonal Autoregressive Integrated Moving Average, SARIMA)
  • 具有外生回归量的季节性自回归整合移动平均线(Seasonal Autoregressive Integrated Moving-Average with Exogenous Regressors, SARIMAX)
自回归模型 AR自回归模型(Autoregressive Model , 简称 AR 模型)是一种时间序列分析方法,用于描述一个时间序列变量与其过去值之间的关系 。AR模型假设当前观测值与过去的观测值之间存在线性关系,通过使用过去的观测值来预测未来的观测值 。
优点:
  • 简单性:AR模型是一种线性模型,易于理解和实现 。它仅使用过去的观测值作为自变量,没有其他复杂的因素需要考虑 。
  • 建模能力:AR模型可以捕捉时间序列数据的自相关结构,即当前观测值与过去观测值之间的关系 。它能够提供对未来观测值的预测,并揭示数据中的趋势和模式 。
缺点:
  • 只适用于平稳序列:AR模型要求时间序列是平稳的,即均值、方差和自相关不随时间变化 。如果序列不平稳,可能需要进行差分操作或使用其他模型来处理非平稳性 。
  • 对过去观测值敏感:AR模型的预测结果受到过去观测值的影响,因此在处理长期预测时可能会出现误差累积的问题 。较大的阶数可能会导致模型过拟合,而较小的阶数可能无法捕捉到时间序列的复杂动态 。
  • 无法处理季节性数据:AR模型无法直接处理具有明显季节性的时间序列 。对于具有季节性模式的数据,可以使用季节性AR模型(SAR)或ARIMA模型进行建模 。
移动平均法(MA)移动平均法(MA):该方法基于数据的平均数,并假设未来的值与过去的值之间具有一定的平稳性 。
优点:
能够捕捉到时间序列数据中的移动平均关系 。MA模型利用过去时间步白噪声误差项的线性组合来预测当前观测值 , 因此可以捕捉到数据中的移动平均性 。
相对简单和直观 。MA模型的参数表示过去时间步白噪声误差项的权重,可以通过估计这些权重来拟合模型 。


推荐阅读