理论教育 时间序列预测模型优化技巧

时间序列预测模型优化技巧

时间:2023-06-13 理论教育 版权反馈
【摘要】:时间序列预测法是一种历史资料延伸预测,也称历史引申预测法。采用时间序列分析进行预测时需要用到一系列的模型,这种模型统称为时间序列模型。在使用这种时间序列模型时,总是假定某一种数据变化模式或某一种组合模式总是会重复发生的。此外,时间序列分析法常常用于中短期预测,因为在相对短的时间内,数据变化的模式不会特别显著,这主要是依据事物发展的惯性原理。

时间序列预测模型优化技巧

所谓时间序列就是一组按照一定的时间间隔排列的一组数据。这一组数据可以表示各种各样的含义的数值,如对某种产品的需求量、产量、销售额等。其时间间隔可以是任意的时间单位,如小时、日、周、月等。通常,对于这些量的预测,由于很难确定它与其他因变量的关系,或收集因变量的数据非常困难,这时我们就不能采用回归分析方法进行预测,或者说,有时对预测的精度要求不是特别高,这时我们都可以使用时间序列分析方法来进行预测。当然,时间序列分析法并非只是一种简单的预测分析方法,其实基本的时间序列分析法确实很简单,但是也有一些非常复杂的时间序列分析方法。

时间序列预测法是一种历史资料延伸预测,也称历史引申预测法。是以时间数列所能反映的社会经济现象的发展过程和规律性,进行引申外推,预测其发展趋势的方法。它是将某种统计指标的数值,按时间先后顺序排列所形成的数列。时间序列预测法就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年内可能达到的水平。其内容包括:收集与整理某种社会现象的历史资料;对这些资料进行检查鉴别,排成数列;分析时间数列,从中寻找该社会现象随时间变化而变化的规律,得出一定的模式;以此模式去预测该社会现象将来的情况。

采用时间序列分析进行预测时需要用到一系列的模型,这种模型统称为时间序列模型。在使用这种时间序列模型时,总是假定某一种数据变化模式或某一种组合模式总是会重复发生的。因此可以首先识别出这种模式,然后采用外推的方式就可以进行预测了。

采用时间序列模型时,显然其关键在于假定数据的变化模式(样式)是可以根据历史数据识别出来;同时,决策者所采取的行动对这个时间序列的影响是很小的,因此这种方法主要用来对一些环境因素,或不受决策者控制的因素进行预测,如宏观经济情况、就业水平、某些产品的需求量;而对于受人的行为影响较大的事物进行预测则是不合适的,如股票价格、改变产品价格后的产品的需求量等。

这种方法的主要优点是数据很容易得到。相对说来成本较低。而且容易被决策者所理解。计算相对简单(当然对于高级时间序列分析法,其计算也是非常复杂的)。此外,时间序列分析法常常用于中短期预测,因为在相对短的时间内,数据变化的模式不会特别显著,这主要是依据事物发展的惯性原理。

人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多地从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。

时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下四种:

(1)趋势性(Trend):指事物的发展规律随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果。

(2)周期性(Cyclic):指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。这种因素是因经济多年的周期性变动产生的。比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增的趋势线上下方。

(3)季节性变化(Seasonal variation):指现象受季节性影响,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。

(4)不规则变化(Irregular movement):指现象受偶然因素的影响而呈现出的不规则波动。这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。

时间序列一般是以上几种变化形式的叠加或组合出现的,如图3-6所示。

978-7-111-51794-8-Chapter03-7.jpg

图3-6 时间序列典型模式

时间序列分析是一种广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而又相关联的数字系列(动态数据),从而描述和探索该现象随时间发展变化的规律性。时间序列的分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析,而模型法应用更确切和适用,同时也比前两种方法复杂,但能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的目的。时间序列分析方法包括:

(1)确定性时序分析:它是暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析方法,其基本思想是用一个确定的时间函数y=ft)来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。具体可分为趋势预测法(最小二乘)、平滑预测法、分解分析法等;

(2)随机性时序分析:其基本思路是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来对时间序列进行预测。相对而言,随机性时序分析更符合实际情况,但建模更复杂。

为了对时间序列分析方法有一个比较全面的了解,现将时间序列分析方法归纳如下:时间序列分为确定性时序分析和随机性时序分析。其中前者包含:发展水平分析、趋势变动分析、周期波动分析、趋势加周期波动分析,可借助于移动平均法、指数平滑法等数学工具;后者包含:一元/多元时序分析、可控/不可控时序分析、马尔科夫分析、贝叶斯分析,可采用自回归AR模型、滑动平均MA模型等。

在随机性时间序列分析中,分为(宽)平稳时序分析和非平稳时序分析。平稳随机过程其统计特性(均值、方差)不随时间的平移而变化,在实际中若前后的环境和主要条件都不随时间变化就可以认为是平稳过程(宽平稳过程),具有(宽)平稳特性的时序称平稳时序。

平稳时序分析主要通过建立自回归模型(AR,Autoregressive Models)、滑动平均模型(MA,Moving Average Models)和自回归滑动平均模型(ARMA,Autoregressive MovingAverageModels)分析平稳的时间序列的规律,一般的分析程序可用下面图3-7框图表示建模流程。

978-7-111-51794-8-Chapter03-8.jpg

图3-7 时间序列建模流程图

(1)自回归模型ARp):如果时间序列Xtt=1,2,…)是平稳的且数据之间前后有一定的依存关系,即Xt与前面Xt-1Xt-2,…,Xt-p有关与其以前时刻进入系统的扰动(白噪声)无关,具有p阶的记忆,描述这种关系的数学模型就是p阶自回归模型可用来预测:

978-7-111-51794-8-Chapter03-9.jpg

式中,ϕ1ϕ2,…,ϕP是自回归系数或称为权系数;at为白噪声,它对Xt产生的响应,它本身就是前后不相关的序列,类似于相关回归分析中的随机误差干扰项,其均值为零,方差为σ2a的白噪声序列。

上面模型中若引入后移算子B,则可改为

978-7-111-51794-8-Chapter03-10.jpg

ϕB)=(1-ϕ1B-ϕ2B2-…-ϕpBp)(www.daowen.com)

则式(3-1)可写成:

ϕBXt=at (3-3)

ϕB)=0为ARp)模型的特征方程。特征方程的p个根λii=1,2,…,p)被称为特征根。如果p个特征根全在单位圆外,即

λi∣>1 i=1,2,…,p (3-4)

则称ARp)模型为平稳模型,式(3-4)被称为平稳条件。由于是关于后移算子B的多项式,因此ARp)模型是否平稳取决于参数ϕ1ϕ2,…,ϕP

(2)滑动平均模型MAq):如果时间序列Xtt=1,2,…)是平稳的与前面Xt-1Xt-2,…,Xt-p无关与其以前时刻进入系统的扰动(白噪声)有关,具有q阶的记忆,描述这种关系的数学模型就是q阶滑动平均模型可用来预测:

978-7-111-51794-8-Chapter03-11.jpg

上面模型中若引入后移算子B,则可改为

978-7-111-51794-8-Chapter03-12.jpg

(3)自回归滑动平均模型ARMA(pq):如果时间序列Xtt=1,2,…)是平稳的与前面Xt-1Xt-2,…Xt-p有关且与其以前时刻进入系统的扰动(白噪声)也有关,则此系统为自回归移动平均系统,预测模型为

978-7-111-51794-8-Chapter03-13.jpg

即(1-1-B2ϕ2-…-BpϕpXt=(1-θ1B-θ2B2-…-θqBqat

识别时间序列法模型的两个工具:自相关函数(ACF,autocorrelation function)、偏自相关函数(PACF,parti alautocorrelation function)。

(1)自相关函数:过程{Yt}的第j阶自相关系数ρj=γj/γ0,自相关函数记为ACF(j)。

(2)偏自相关函数:偏自相关系数ρ*j度量了消除中间滞后项影响后两滞后变量之间的相关关系。偏自相关函数记为PACF(j)。

(3)自相关函数和偏自相关函数的联系:

ρ*j=ρ1 (3-7)

ρ*2=(ρ221)/(1-ρ21) (3-8)

AR、MA、ARMA三种模型自相关和偏自相关函数特征,见表3-1。

表3-1 三种函数的两种特征

978-7-111-51794-8-Chapter03-14.jpg

随机过程的随机特征随时间变化,则称过程是非平稳的,在实际的社会经济现象中我们收集到的时序大多数是呈现出明显的趋势性或周期性,这样我们就不能认为它是均值不变的平稳过程,要用模型来预测应把趋势和波动综合考虑进来,是它们的叠加,这样非平稳时间序列分析与实际社会现象更接近,应用更为广泛。用模型来描述:

Xt=µt+Yt (3-9)

式中,µt表示Xt中随时间变化的均值(往往是趋势值);YtXt中剔除µt后的剩余部分,表示零均值平稳过程,就可用自回归模型、滑动平均模型或自回归滑动平均模型来拟合。

要求解非平稳时间序列模型Xt=µt+Yt,可分以下两步:

1)具体求出µt的拟合形式,可以用上面介绍的确定性时序分析方法建模,求出µt,得到拟合值,记为978-7-111-51794-8-Chapter03-15.jpg

2)对残差序列978-7-111-51794-8-Chapter03-16.jpg进行分析处理,使之成为均值为零的随机平稳过程,再用平稳随机时序分析方法建模求出Yt,通过反运算,最后可得Xt=µt+Yt

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈