时间序列-平稳性

2024-04-27

1. 时间序列-平稳性

 1、平稳性:   1)平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段时间内仍能顺着现有的形态“惯性”地延续下去。   2)平稳性要求序列的 均值和方差 不发生 明显 变化。   2、严平稳与弱平稳:   1)严平稳:严平稳表示的分布不随时间的改变而改变。如:白噪声(正态),无论怎么取都是期望为0,方差为1.   2)弱平稳:期望与相关系数(依赖性)不变   未来某时刻的t值Xt就要依赖于它的过去信息,所以需要依赖性。   2、差分法   1)时间序列在t与t-1时刻的差值   
                                           

时间序列-平稳性

2. 时间序列的平稳性

 并不是所有的时间序列都是可预测的,想象一下,假如一个时间序列的变化特性是不稳定的,那么它每个时期的波动对于之后一个时期的变化的影响都是无法预测的,因为它随时可能变脸。而当一个时间序列的变化特征维持稳定,数据的历史分布和未来分布就会趋于一致,这时我们就可以根据历史数据对未来作出预测。用来刻画数据变化特征稳定的量就是时间序列的平稳性。
                                           
   
                                           如果图像没有明显的趋势,围绕着一个水平线稳定波动,序列传播没有明显的疏密变化,则可以判定为稳定序列。当然这种方法过于主观,还是需要更为严密的统计学检验。
   观察图像的方式很直观,但也很主观,不适用于机器自动判断序列的稳定性。因此我们需要一个更有说服力、更加客观的统计方法来帮助我们检验时间序列的平稳性,这种方法,就是单位根检验。
   当一个时间序列的滞后算子多项式方程 存在单位根时 ,我们认为该时间序列是 非平稳 的;反之,当该方程 不存在单位根 时,我们认为该时间序列是 平稳 的。其原理比较复杂,想要理解它需要较好的数学基础,这里我们只关注在Python中如何使用。
   常见的单位根检验方法有 DF检验 、 ADF检验 和 PP检验 ,这里演示如何使用最常用的ADF检验。   (1)Python中的statsmodels库提供ADF检验函数,使用时需要引入    from statsmodels.tsa.stattools import adfuller as ADF 
   (2)具体函数如下:    statsmodels.tsa.stattools.adfuller(x, maxlag=None, regression='c', autolag='AIC', store=False, regresults=False) 
   (3)返回值解析:   (-5.2350403606036302, 7.4536580061930903e-06, 0, 60, {'1%': -3.5443688564814813, '5%': -2.9110731481481484, '10%': -2.5931902777777776}, 1935.4779504450603)

3. 平稳时间序列的介绍

平稳时间序列粗略地讲,一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称之是平稳的。

平稳时间序列的介绍

4. 时间序列分析


5. 什么是平稳的时间序列

问题一:如何深入理解时间序列分析中的平稳性  声明:本文中所有引用部分,如非特别说明,皆引自Time Series Analysis with Applications in R. 
  接触时间序列分析才半年,尽力回答。如果回答有误,欢迎指出。 
  对第一个问题,我们把它拆分成以下两个问题: 
  Why stationary?(为何要平稳?) 
  Why weak stationary?(为何弱平稳?) 
  Why stationary?(为何要平稳?) 
  每一个统计学问题,我们都需要对其先做一些基本假设。如在一元线性回归中(),我们要假设:①不相关且非随机(是固定值或当做已知)②独立同分布服从正态分布(均值为0,方差恒定)。 
  在时间序列分析中,我们考虑了很多合理且可以简化问题的假设。而其中最重要的假设就是平稳。 
  The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time. 
  平稳的基本思想是:时间序列的行为并不随时间改变。 
  正因此,我们定义了两种平稳: 
  Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, ・ ・ ・, is the same as that of,, ・ ・ ・ ,for all choices of natural number n, all choices of time points ,, ・ ・ ・ , and all choices of time lag k. 
  强平稳过程:对于所有可能的n,所有可能的,, ・ ・ ・ , 和所有可能的k,当,, ・ ・ ・,的联合分布与,, ・ ・ ・ ,相同时,我们称其强平稳。 
  Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if: 
  ① the mean function is constant over time, and 
  ② γ(t, t ? k) = γ(0, k) for all times t and lags k. 
  弱平稳过程:当①均值函数是常数函数且②协方差函数仅与时间差相关,我们才称其为弱平稳。 
  此时我们转到第二个问题:Why weak stationary?(为何弱平稳?) 
  我们先来说说两种平稳的差别: 
  两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳。 
  一方面,虽然看上去强平稳的要求好像比弱平稳强,但强平稳并不一定是弱平稳,因为其矩不一定存在。 
  例子:{}独立服从柯西分布。{}是强平稳,但由于柯西分布期望与方差不存在,所以不是弱平稳。(之所以不存在是因为其并非绝对可积。) 
  另一方面,弱平稳也不一定是强平稳,因为二阶矩性质并不能确定分布的性质。 
  例子:,,互相独立。这是弱平稳却不是强平稳。 
  知道了这些造成差别的根本原因后,我们也可以写出两者的一些联系: 
  一阶矩和二阶矩存在时,强平稳过程是弱平稳过程。(条件可简化为二阶矩存在,因为) 
  当联合分布服从多元正态分布时,两平稳过程等价。(多元正态分布的二阶矩可确定分布性质) 
  而为什么用弱平稳而非强平稳,主要原因是:强平稳条件太强......>> 
  
   问题二:什么是平稳时间序列,能举个生活中的平稳时间序列的例  “平稳时间序列”是天文学专有名词。来自 中国天文学名词审定委员会审定发布的天 文学专有名词中文译名,词条译名和中英 文解释数据版权由天文学名词委所有。 
  中文译名平稳时间序列 
  英文原名/注释stationarytime series :小波消噪与时间序列分析方 法在预测领域中应用十分广泛,但是在降 雨量的预测中应用不多。在基于小波消 噪的基础上应用时间序列中平稳时间学 列方法对降雨量进行预测,结果显示,应用 该方法有效地提高了降雨量的预测精 度。用丹东地区1971-2006年的降雨量作 为历史数据,建立降雨量预测模型,结果表 明新模型算法简单、精度较高,比传统的 拓扑预测模型效果更好,为降雨量预测提 供了一种行之有效的方法 
  
   问题三:平稳时间序列和非平稳时间序列的区别  要对非平稳时间序列 进行平稳化处理 有利于资源的合理利用 
  
   问题四:检验时间序列平稳性的方法有哪两种  1、 时间序列 取自某一个随机过程,如果此随机过程的随机特征不随时间变化,则我们称过程是平稳的;假如该随机过程的随机特征随时间变化,则称过程是非平稳的。 2、 宽平稳时间序列的定义:设时间序列 ,对于任意的 , 和 ,满足: 则称 宽平稳。 3、Box-Jenkins方法是一种理论较为完善的统计预测方法。他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA模型识别、估计和诊断的系统方法。使ARMA模型的建立有了一套完整、正规、结构化的建模方法,并且具有统计上的完善性和牢固的理论基础。 4、ARMA模型三种基本形式:自回归模型(AR:Auto-regressive),移动平均模型(MA:Moving-Average)和混合模型(ARMA:Auto-regressive Moving-Average)。 (1) 自回归模型AR(p):如果时间序列 满足 其中 是独立同分布的随机变量序列,且满足: , 则称时间序列 服从p阶自回归模型。或者记为 。 平稳条件:滞后算子多项式 的根均在单位圆外,即 的根大于1。 (2) 移动平均模型MA(q):如果时间序列 满足 则称时间序列 服从q阶移动平均模型。或者记为 。 平稳条件:任何条件下都平稳。 (3) ARMA(p,q)模型:如果时间序列 满足 则称时间序列 服从(p,q)阶自回归移动平均模型。或者记为 。 特殊情况:q=0,模型即为AR(p),p=0, 模型即为MA(q)。 二、时间序列的自相关分析 1、自相关分析法是进行时间序列分析的有效方法,它简单易行、较为直观,根据绘制的自相关分析图和偏自相关分析图,我们可以初步地识别平稳序列的模型类型和模型阶数。利用自相关分析法可以测定时间序列的随机性和平稳性,以及时间序列的季节性。 2、自相关函数的定义:滞后期为k的自协方差函数为: ,则 的自相关函数为: ,其中 。当序列平稳时,自相关函数可写为: 。 3、 样本自相关函数为: ,其中 ,它可以说明不同时期的数据之间的相关程度,其取值范围在-1到1之间,值越接近于1,说明时间序列的自相关程度越高。 4、 样本的偏自相关函数: 其中, 。 5、 时间序列的随机性,是指时间序列各项之间没有相关关系的特征。使用自相关分析图判断时间序列的随机性,一般给出如下准则: ①若时间序列的自相关函数基本上都落入置信区间,则该时间序列具有随机性; ②若较多自相关函数落在置信区间之外,则认为该时间序列不具有随机性。 6、 判断时间序列是否平稳,是一项很重要的工作。运用自相关分析图判定时间序列平稳性的准则是:①若时间序列的自相关函数 在k>3时都落入置信区间,且逐渐趋于零,则该时间序列具有平稳性;②若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。 7、 ARMA模型的自相关分析 AR(p)模型的偏自相关函数 是以p步截尾的,自相关函数拖尾。MA(q)模型的自相关函数具有q步截尾性,偏自相关函数拖尾。这两个性质可以分别用来识别自回归模型和移动平均模型的阶数。ARMA(p,q)模型的自相关函数和偏相关函数都是拖尾的。 三、单位根检验和协整检验 1、单位根检验 ①利用迪基―福勒检验( Dickey-Fuller Test)和菲利普斯―佩荣检验(Philips-Perron Test),我们也可以测定时间序列的随机性,这是在计量经济学中非常重要的两种单位根检验方法,与前者不同的事,后一个检验方法主要应用于一阶自回归模......>> 
  
   问题五:如果时间序列平稳,那该做什么检验  我们计算自相关系数,如果有18组数据,则有17个自相关系数的数据,如果时间序列是平稳的,那么服从一个正态分布。所以我们根据每一个自相关系数的值,对应置位区间即可。 
  也可检验对所有k>0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行 
  该统计量近似地服从自由度为m的c2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为a的临界值,则有1-a的把握拒绝所有rk(k>0)同时为0的假设。 
  注意利用QLB统计量,原假设是平稳的,根据最大的滞后项来判断即可。

什么是平稳的时间序列

6. 时间序列分析

时间序列 概念 :同一现象在不同时间上的相继观察值排列而成的数列
  
 形式上由现象所属的时间和现象在不同时间上的观察值两部分组成
  
 排列的时间可以是年、季度、月...
  
 
  
  
 时间序列的 分类 :
  
 1.绝对数序列:
  
 一系列绝对数按时间顺序排列而成;最基本的表现形式;反映在不同时间上所达到的绝对水平(时期序列,一段时期内总量的排序、时点序列,某一瞬间时点上总量的排序)
  
 2.相对数序列:一系列相对数按时间顺序排列而成
  
 3.平均数序列:一系列平均数按时间顺序排列而成
  
 
  
  
 时间序列的 编制原则 :
  
 时间长短一致
  
 总体范围一致
  
 指标内容一致
  
 计算方法和口径一致
  
 
  
  
  一、时间序列的对比分析 
  
    
  
  水平分析: 
  
 1.发展水平:现象在不同时间上的观察值;说明现象在某一时间上所达到的水平;
  
 2.平均发展水平:现象在不同时间上取值的平均数,又称序时平均;说明现象在一段时间内所达到的一般水平;(不同序列的类型选择不同的计算方法-时期、连续时点(逐日排序)、不等距时点(加权)、等距时点(不等距的特例));
  
 #相对数:两个绝对数相除
  
 #相对数的序时平均数:分子的平均数与分母的平均数相除
  
 3.增长量:报告期水平与基期水平之差,说明现象在观察期内增长的绝对数量
  
 分为逐期增长量(报告期水平与前一期水平之差)与累计增长量(报告期水平和某一固定时期水平之差)--各逐期增长量之和等于最末期的累计增长量
  
 4.平均增长量:各逐期增长量的平均数,等于逐期增长量之和/逐期增长量个数(也就是观察值个数-1)
  
 
  
  
  速度分析: 
  
 1.发展速度:报告期水平与基期水平之比,说明现象在观察期内相对的发展变化程度,
  
 分为环比发展速度(报告期水平和前一期水平之比)与定期发展速度(报告期与某一固定时期水平之比)--各环比发展速度之积等于最末期定期发展速度;
  
 2.增长速度(增长率):增长量与基期水平之比,说明现象的相对增长程度,
  
 等于发展速度-1;分为环比增长速度和定基增长速度;
  
 3.平均发展速度:观察期内各环比发展速度的平均数,说明现象在整个观察期内平均发展变化的程度(几何法算平均数)
  
 4.平均增长速度:等于平均发展速度-1
  
 
  
  
  二、时间序列的趋势分析 
  
 可以采用移动平均、最小二乘法等...
  
 
  
  
  三、季节变动分析 
  
 季节变动:现象在一年内随着季节更换形成的有规律变动;各年变化强度大体相同,且没年重现;
  
 扩展:对一年内由于社会、政治、经济、自然因素影响,形成的以一定时期为周期的有规则的重复变动;
  
 测定目的:确定现象过去的季节变化规律,消除时间序列中的季节因素;
  
 分析原理:将季节变动规律归纳为一种典型的季节模型;季节模型由季节指数所组成;季节指数的平均数等于100%;根据季节指数与其平均数的偏差程度测定季节变动的程度;
  
 
  
  
 季节指数:1.反映季节变动的相对数;2.以全年或季资料的平均数为基础计算的;3.平均数等于100%;4.指数越远离其平均数季节变动程度越大;5.同期平均法和趋势剔除法
  
 
  
  
 同期平均法:
  
 根据原时间序列通过简单平均计算季节指数
  
 假定时间序列没有明显的长期趋势和循环波动
  
 步骤:1.计算同期平均数;2.计算全部数据总季的平均数;3.计算季节指数S=同期平均数/总季平均数
  
 
  
  
 趋势剔除法:
  
 先将时间序列中长期趋势予以消除,在计算季节指数
  
 步骤:1.计算移动平均趋势值Y;2.从序列中剔除趋势值Y/T;3.按上述方法计算季节指数
  
 四项移动平均后再进行二项移动平均(四项做年的去掉季节,二项更为稳定)
  
 
  
  
 季节变动的调整:将季节变动剔除,方法是江源时间序列除以相应的季节指数
  
 
  
  
  四、循环波动分析 
  
 循环波动:近乎规律性的从低到高再从高至低的周而复始的变动;不同于趋势变动,他不是朝着单一方向的持续运动,而是涨落相间的交替波动;不同于季节波动,其变化无固定规律,变动周期多在一年以上,且周期长短不一
  
 目的是探索现象活动的规律性
  
 
  
  
 测定方法:采取剩余法
  
 计算步骤:1.先消除趋势值,求得无长期趋势数据资料;2.再消去季节变动(原始数据/季节指数),求得循环及不规则波动相对数;3.将结果移动平均,以消除不规则波动,即得循环波动值

7. 时间序列分析

时间序列顾名思义即是通常在连续时间上采集的序列数据。例如股票指数数据、营收数据和天气数据等。时间序列分析是利用已知数据使用合适的模型拟合时间序列同时估算相应模型的参数。时间序列分析的模型与方法体现了我们对于时间序列自然属性的理解。同时这些模型方法也能够用于对时间序列进行预测和模拟。
  
 与信号分析类似,时间序列分析的方法也有时间域和频率域的方法;有单变量和多变量方法;有线性方法和非线性方法;连续序列和离散序列。
  
 一般时间序列可以依据变化特征分解为四个部分,即趋势(trend)、季节性(seasonal)、周期性(cyclical)和不规则(irregular)部分。
  
 构建时间序列预测模型的一种重要是方法使用随机过程理论。这与地质统计的分析方法是相同的,只是分析对象不同:时间序列为时间点上的数据而地质统计为空间点上的数据。这里认为时间序列上的数据点为随机变量,整个时间序列为一个随机函数。描述不同时间点上的数据之间的关系,同样要使用自协方差、自相关函数。同时二者同样实在稳态假设之下进行分析,应用中也需要对于数据进行去除趋势等处理使之满足稳态条件。时间序列分析中的自回归模型(AR)相当于地质统计中的简单克里金。

时间序列分析

8. 时间序列分析

 在R中生成时间序列的前提是我们将分析对象转成时间序列函数对象,包括观测值、起始时间、种植时间、及周期(月、季度、年)的结构。这些都能通过ts( )函数实现。
   R语言中,对时间序列数据进行分析处理时,使用差分函数要注意:差分函数diff()不带参数名的参数指滞后阶数,也就是与滞后第几阶的数据进行差分。如果要指定差分的阶数,则一定要使用带名称的参数:diff=2。
   例如: sample表示样本数据。
   1、diff(sample,2)表示是对滞后2阶的数据进行差分,一阶差分,等同于: diff(sample,lag=2)
   2、diff(sample,diff=2)才是表示二阶差分
   意:在函数中尽量避免使用没有命名的参数。在《时间序列分析及应用-R语言(第2版)》中,P315,描述到: 我们得到的教训就是,除非完全了解相关参数的位置,否则使用未命名参数是非常危险的。
   截尾是指时间序列的自相关函数(ACF)或偏自相关函数(PACF)在某阶后均为0的性质(比如AR的PACF);
   拖尾是ACF或PACF并不在某阶后均为0的性质(比如AR的ACF)。
    拖尾 :始终有非零取值,不会在k大于某个常数后就恒等于零(或在0附近随机波动)
    截尾 :在大于某个常数k后快速趋于0为k阶截尾
    AR模型:自相关系数拖尾,偏自相关系数截尾; 
    MA模型:自相关系数截尾,偏自相关函数拖尾; 
    ARMA模型:自相关函数和偏自相关函数均拖尾。 
   根据输出结果, 自相关函数图拖尾,偏自相关函数图截尾 ,且n从2或3开始控制在置信区间之内,因而可判定为AR(2)模型或者AR(3)模型。