时间序列分析与量化交易(1)||AR、MA、ARMA、ARIMA、平稳性、单位根、白噪声
时间序列分析是现代计量经济学的重要内容。
概率分布的阶矩:
1. 一阶矩:均值
2. 二阶矩:方差
3. 三阶矩:偏度(Skewed Distributions)
4. 四阶矩:峰度(Kurtosis),随机变量概率密度函数尾部的厚尾(宽度)
-
平稳性
-
严格平稳过程(Strictly Stationary Process):序列的 概率测度在时间的平移变换下保持不变。
-
弱平稳过程(Weakly Stationary Process)
如果一个时间序列概率分布的所有阶矩都不随时间变化,那它就是严格平稳的;
如果只是一阶矩和二阶矩不随时间变化,那它就是弱平稳。
金融文献中,通常假定资产收益率序列是弱平稳的。
弱一个时间序列是非平稳的,我们只能研究其在研究期间的行为,每个时间序列数据集都是特定的一幕,就无法把结论推广到其他期间。也就不存在预测的价值了。
-
-
自协方差(Auto - Covariance)
自协方差决定是如何与它自身的先前值相关的,对于一个平稳的时间序列,它只依赖于与之差。
-
白噪声过程(White Noise Process)
如果时间序列是一个有有限均值和有限方差的、独立同分布的随机变量序列,则称时间序列为白噪声。
白噪声序列,自相关系数为零。实际应用中,如果所有样本的自相关函数接近为零,则认为这个序列为白噪声序列。
若一个随机过程满足:
则称之为白噪声过程(White Noise Process) -
单位根
当时间序列含有单位根时,它就是一个非平稳时间序列。
-
单整性
若一个非平稳时间序列,必须经过次差分后才能变成一个平稳的、可逆的时间序列,则称具有阶单整性。
若对每一个固定的,是一个随机变量,则为随机时间序列。
如果时间序列可以表示为:
其中:
:白噪声,
则称为一阶自回归过程,简称。
以上称为p阶自回归过程,记作。模型阶的决定有两种方式:
- 偏自相关系数(Partial Auto-Correlation Function,PACF)
- 信息准则函数
- 赤池信息准则(AIC)
- 施瓦茨(Schwarz)贝叶斯信息准则(SBIC)
如果时间序列可以表示为:
以上称为q阶的移动平均(Moving-Average )过程,记作。
如果时间序列可以表示为:
以上称为自回归移动平均模型,记作。
Box和Jenkins1976年提出ARIMA(p,d,q),该模型是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值及其随机误差项的现值和滞后值进行回归所建立的模型。
ARMA模型要求时间序列是平稳的;(实际经济运行中的大多数时间序列都是非平稳的)
ARIMA模型通过差分法消除时间序列的非平稳趋势建立平稳的时间序列;(但是解释性降低)
1987年Engle和Granger提出协整(Cointegration)理论,解决非平稳时间序列的建模困境。
-
协整关系
经济运行中,单组时间序列变量大多都是随机游走的,但是他们的某个线性组合确可能是平稳的,因为他们可能收到某些共同因素的影响。
两个或两个以上同阶单整的非平稳时间序列变量的线性组合是平稳时间序列,则这些变量之间就存在协整关系。
-
协整检验
协整检验用来检验非平稳变量之间是否存在长期均衡关系。
如果非平稳变量之间存在协整关系,则他们之间的离差即非均衡误差是平稳的(这里可能就是文章《沪深300股票聚类可视化案例||tushare完整可运行代码逐行解释》中为什么采用作为输入数据的理论依据吧?!)。
- E-G两步法(Engle-Granger1987年提出,用于检验两变量之间的协整关系)
- Johansen检验(1988年,基于向量自回归模型(Vector Autoregression,VAR),检验多变量)
-
各类相关模型简记
-
误差修正模型(Error Correction Model, ECM)
传统的经济模型通常表示的是变量之间的一种长期均衡关系,但是经济变量之间在短期来看往往是非均衡的。因此,建模时需要用数据的动态非均衡过程来逼近经济理论的长期均衡过程。最常见的就是ADl(Autoregressive Distributed Lag,自回归分布滞后模型)。误差修正模型包含在ADL中。
-
向量自回归模型(VAR,,1980)
如果事先并不知道哪个变量为被解释变量,哪个变量为解释变量,因而很难确定变量之间的协整关系。
VAR用于解决此问题,VAR中不去分内生变量和外生变量,而是全部看成内生变量。
-
脉冲响应函数(Impulse Response Function)
是指系统对其中某一个变量的一个冲击或信息所作出的反应。
-
预测方差分解(Variance Decompositions,,1980)
向量自回归模型的预测方差分解是一种判断经济序列变量间动态相关性的重要方法,能定量的把握变量间的影响关系。
本质是一个新生计算过程,是将系统的预测均方误差分解为系统中各变量冲击所做的贡献。
-
自回归条件异方差(Autoregressive Conditionally Heteroscedastic,ARCH,$R \cdot Engle$1982) 非线性模型
-
广义自回归条件异方差(Generalized ARCH,$Bollerslev$1986)
-
推荐阅读
-
load data infile将excel文件中的数百万条数据在1分钟内导入数据_MySQL
-
ocp 1Z0-051 1-22题解析
-
display:none;与visibility:hidden;的区别_html/css_WEB-ITnose
-
PHP与正则表达系列之一: PHP中的正则表达式_PHP教程
-
linux下开启mysql慢查询,分析查询语句_MySQL
-
时间序列分析与量化交易(1)||AR、MA、ARMA、ARIMA、平稳性、单位根、白噪声
-
分析ECMall的注册与登录机制
-
php读取数据库内容然后判断用户的注册时间,大于多久的自动发送一封邮件,该怎么解决
-
解析关于java,php以及html的所有文件编码与乱码的处理方法汇总
-
Javascript 按位与运算符 (&)使用介绍_基础知识