«地学建模» 之 “随机时间序列分析模型”.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
第六章 动态模型.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
第五章 平稳时间序列预测 设当前时刻为t,我们已经知道平稳时间序列Xt在时刻t 及以前时刻的观察值Xt ,Xt-1,Xt-2… ,现在用序列Xt对时刻t以后的观察值Xt+l(l>0)进行预测。这种预测称为以t 为原点,向前步长为l的预测,预测值记为.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第3节 二次型与二次型的化简 一、二次型的定义 二、二次型的化简(矩阵的合同) 下页.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
§1 二阶与三阶行列式 ★二元线性方程组与二阶行列式 ★三阶行列式
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
Tel: 第八章 时间序列分析 周早弘 旅游与城市管理学院
金融风险评估与管理 估值 投资组合 风险管理-三大块
第三章 函数逼近 — 最佳平方逼近.
第9章 平稳时间序列分析.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
《高等数学》(理学) 常数项级数的概念 袁安锋
第二章 平稳时间序列模型(单变量) 选择单变量时间序列的原因
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
第十章 时间序列的特性.
时间序列分析与预测 第二讲:时间序列模型 大连理工大学经济系 原毅军.
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
恰当方程(全微分方程) 一、概念 二、全微分方程的解法.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
不确定度的传递与合成 间接测量结果不确定度的评估
第四节 一阶线性微分方程 线性微分方程 伯努利方程 小结、作业 1/17.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
ARIMA模型在电量预测中的应用 蔡跳
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第三章 平稳时间序列分析.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
清华大学自动化系 张贤达 电话: 第三章 现代谱估计 清华大学自动化系 张贤达 电话:
第六章 多元时间序列分析.
7 平稳时间序列预测法 7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模 回总目录.
非平稳和季节时间序列模型分析方法 在第四章中,我们介绍了非平稳时间序列模型,但是在前面的讨论中,对于时间序列的特性分析,以及模型的统计分析都集中于平稳时间序列问题上。本章将介绍几个非平稳时间序列的建模方法,并且分析不同的非平稳时间序列模型的动态性质。 上海财经大学 统计学系.
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第五章 非平稳序列的随机分析.
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
3.1.2 空间向量的数量积运算 1.了解空间向量夹角的概念及表示方法. 2.掌握空间向量数量积的计算方法及应用.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
§2 方阵的特征值与特征向量.
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 平稳时间序列分析.
本底对汞原子第一激发能测量的影响 钱振宇
三角 三角 三角 函数 余弦函数的图象和性质.
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

«地学建模» 之 “随机时间序列分析模型”

§4 随机时间序列分析模型 1. 随机时间序列模型的基本类型 2. 随机时间序列分析模型的识别 3. 时间序列模型常用定阶准则 4. 随机时间序列分析模型的参数估计 5. 季节自回归滑动平均(ARIMA)模型 6. 时间序列建模分析

1 基本类型 1.1 自回归(AR)模型 1.2 滑动平均(MA)模型 1.3 自回归滑动平均(ARMA)模型

1.1 自回归(AR)模型 若时间序列值xt可表示为它的先前值xt-1和一白噪声的线性函数,则称此模型为自回归模型,相应的序列xt称为自回归序列,称 为p-阶(p-Order)自回归模型,简称AR(p)模型。 at是一个误差或白噪声序列,并假定它相互独立,且服从均值为零,方差为 的正态分布。 此处 是自回归参数或权参数。

at与at的先前值xt-i无关,且满足:

引入后移算子B,使得 借助后移算子,则AR(p)模型可化为 , 此式即为 移项整理即为:          记 则模型可写为

1.2 滑动平均(MA)模型 若序列值 是现在和过去的误差或白噪声的线性组合,即 q-阶滑动平均序列,简记为MA(q)模型。   此模型称为滑动平均模型,相应的序列称为 q-阶滑动平均序列,简记为MA(q)模型。 为滑动平均参数。

同样使用后移算子,则该模型可写为: 记: 则:

1.3 自回归滑动平均(ARMA)模型 1.3.1 ARMA模型的概念 若序列值 是现在和过去的误差或白噪声以及 先前序列值的线性组合,即   该模型称为自回归滑动平均模型(ARMA(p,q)模型)p,q分别为自回归与滑动平均的阶数。   相应的参数 分别称为自回归参数和滑动平均参数。

若使用后移算子B,该模型可简记为: AR模型和MA模型是ARMA模型的特例。

自回归模型平稳性条件 对AR(1)模型: 若序列是平稳的,则有 ,有:

自回归模型平稳性条件 若使 的根全在单位圆外,则称 满足p阶平稳自回归模型,即AR(p) 。 其系数向量

滑动平均模型的可逆性条件   此即为MA(1)模型的逆转形式。若|θ1|<1,表明序列历史值对当前值的影响,随时间的推移越来越小,否则过去对现在的影响越来越大,则不合理。

滑动平均模型的可逆性条件 的根全在单位圆外,则称 满足q阶平稳滑动平均模型。 其系数向量 所构成的集合,称为MA(q)模型的可逆域。

ARMA(p,q)模型的平稳与可逆条件 即分别满足平稳性和可逆性条件,且 和 无公共因子,则称 若 的根全在单位圆外,

1.3.2 ARMA模型的传递与逆转形式 传递形式指将序列 的当前值表示为当前 的线性组合 白噪声 与过去白噪声 MA模型本身即为传递形式; 的当前值和过去值的 传递形式指将序列 的当前值表示为当前 MA模型本身即为传递形式; AR模型即为逆转形式。   逆转形式是以序列 线性组合来表示当前误差 与过去白噪声 的线性组合 白噪声

1.3.2 ARMA模型的传递与逆转形式 对于ARMA(p,q)模型 ,若 存在,则其传递形式为: 若 有意义,则其逆转形式为:

2. 随机时间序列分析模型的识别 2.1自相关函数和偏自相关函数 2.2 模型识别 2.1.1 AR(p)的自相关函数  2.1.2 MA(q)的自相关函数  2.1.3 ARMA(p,q)的自相关函数  2.1.4 ARMA(p,q)偏自相关函数 2.2 模型识别  2.2.1 AR(p)模型的识别  2.2.2 MA(q)模型的识别

2.1自相关函数和偏自相关函数 模型识别是进行参数估计的前提; 主要任务:   模型识别是进行参数估计的前提; 主要任务: 找出ARMA(p,q)、AR(p)、MA(q)模型的具体特征,从而利用这些特征去识别具体的时间序列模型。 识别方法: 计算时间序列样本的自相关函数和偏自相关函数,对照各类模型相应函数的具体特征进行,其中以模型定阶最为重要。

2.1.1 AR(p)的自相关函数 AR(p)模型的自协方差函数为: 有自相关函数: (3.48) 平稳时间序列自相关函数为偶函数   平稳时间序列自相关函数为偶函数 有自相关函数: (3.49)   AR(p)序列自相关函数是非截尾序列,称为拖尾序列。自相关函数拖尾是AR(p)序列的一个特征。

当 时,运用相关函数的对称性, 可得到方程组: 此方程组被称为Yule Walker方程组。若已知模型参数 ,可求 ,然后递推求得所有的 ;反之,若已知 ,运用上述方程组可 以及 。 通过下式计算: (3.51) 求模型参数 (3.50)

2.1.2 MA(q)的自相关函数 MA(q)模型的自协方差函数为: (3.52) (3.53) 有自相关函数: (3.54)

当k>q时, 与 因此,当k>q时, 根据自相关函数从某点开始是否始终为零来判断 MA(q)模型的阶。 不相关, 这种现象称为截尾。 是MA(q)的一个特征。

2.1.3 ARMA(p,q)的自相关函数   ARMA(p,q)的自相关函数,可认为是AR(p)和MA(q)模型自相关函数的复合。当p=0时,具有截尾性质;当q=0时,具有拖尾性质;当p、q均不为0时,具有拖尾性质。

ARMA(p,q)的自协方差函数 (3.55) 因此,当 时, 则有 (3.57) 其中: (3.56)

ARMA(p,q)的自相关函数: (3.58) 可见ARMA(p,q)的自相关函数 有如下性质,当 时,仅依赖于模型参数 以及 。即 后, 满足差分方程 也可写成: (3.59)

2.1.4 ARMA(p,q)偏自相关函数 偏自相关函数是ARMA(p,q)模型的另一统计特征, 中  根据AR(p) 模型的拖尾性质,可根据方差最小原则来求取偏自相关系数: AR(p)主要特征是k>p时, 即 是对已知序列 (3.60) 间相关关系的度量。 在p以后截尾。  对于ARMA(p,q)与MA(q)模型,可以证明它们的偏自相关函数具拖尾性质。 的计算可通过求解Yule Walker方程组获得。

2.2 模型识别 2.2.1 AR(p)模型的识别 若 的偏自相关函数 在p步以后截尾,即k>p时, ,而且其自相关函数 是拖尾的,         仅具有理论意义,由于样本的随机 性,样本的偏自相关函数是理论偏自相关函数的估计 值,偏自相关函数可能会在零上下波动。 则此序列是AR(p)序列。

2.2.2 MA(q)模型的识别 若随机序列的自相关函数截尾,且q步之后偏自相关函数是拖尾的,则此序列是MA(q)序列。同样 仅具有理论意义,实际样本的自相关函数也会在零上下波动。  若随机序列的自相关函数和偏自相关函数都是拖尾的,则此序列是ARMA(p,q)序列。

总 结 当自相关函数按指数曲线衰减而趋于0时,表明是AR模型,且其阶数取决于显著不等于0的偏自相关函数的数目; 总 结   当自相关函数按指数曲线衰减而趋于0时,表明是AR模型,且其阶数取决于显著不等于0的偏自相关函数的数目;   如果偏自相关函数按指数曲线衰减而趋于0时,表明是MA模型,其阶数决定于统计上显著的自相关函数的数目;   当自相关函数和偏自相关函数均按指数曲线衰减而趋于0时,其模型是混合的ARMA模型。

随机时间序列模型的基本性质 AR(P) MA(q) ARMA(p,q) 模型方程 平稳条件 的根全在单位圆外 平稳 的根全在单位圆外    的根全在单位圆外 平稳     的根全在单位圆外 可逆条件 可逆 传递形式 逆转形式 自相关函数 拖尾 截尾 偏自相关函数

5. 季节自回归滑动平均(ARIMA)模型 由于地学序列往往表现出随时间变化的趋势性,并可能存在季节性和方差的不稳定性。因此非平稳序列的平稳化,对于时间序列的统计分析和预测具有重要意义。 5.1 非平稳序列的平稳化方法 5.2 季节模型

5.1.1 消除趋势 确定性趋势(线性和非线性): 方程拟合,原序列值与拟合趋势值相减 非确定性趋势: 差分法消除 设原序列为 称 为序列的一阶差分。 为序列的二阶差分。 称 为序列的d阶差分 相应地, 其中 为差分算子。

序列的差分可消除序列的趋势,一般地,一阶差分可消除线性趋势,二阶差分可消除二次曲线趋势。如对 则有:

非农业人口的差分表 年份 非农人口xt xt+1 一阶差分yt(1) yt+1(1) 二阶差分yt(2) yt+1(2) 三阶差分yt(3) 1985 101.02 102.19 1.17 4.31 3.14 0.27 -2.87 1986 106.5 4.58 -2.38 -2.65 1987 111.08 2.2 0.49 2.87 1988 113.28 2.69 -0.64 -1.13 1989 115.97 2.05 -0.08 0.56 1990 118.02 1.97 1.27 1.35 1991 119.99 3.24 5.9 4.63 1992 123.23 9.14 -5.56 -11.46 1993 132.37 3.58 -0.71 4.85 1994 135.95 1.49 1995 138.82 4.36 -1.03 -2.52 1996 143.18 3.33 1.7 2.73 1997 146.51 5.03 2.9 1.2 1998 151.54 7.93 1999 159.47 2000 Mean 126.195 3.897 0.483 -0.018

5.1.2 消除季节(周期)影响 通过定义周期差分,可以消除季节或其它周期性变化的影响。设周期(季节)长度为T,则周期差分定义为: 同样地,二阶周期差分定义为: 分别适用于分季资料和分月资料。

一个d阶多项式和一个周期为T的周期项组成. 即为平稳时间序列。 因此如果一个非平稳时间序列 的趋势项由 则可经过d阶差分处理和周期差分处理后,形成新的序列

5.1.3 消除不平稳方差 对于不平稳方差通常采用变量代换的办法消除,若序列方差与序列发展水平成比例,则对原序列进行对数变换,变换结果修正过度,则又可采用平方根变换加以消除。

5.2 季节模型

5.2.2 ARIMA(p,d,q)(P,D,Q)模型

如对于ARIMA(1,1,1)(1,1,1)12模型,有: (3.85) 此为ARIMA(1,0,1)(1,0,1)12模型具体形式

6. 时间序列建模分析 6.1 时间序列建模的基本步骤 相比于其它预测方法,随机时间序列预测方法有其独特的优势,主要表现在: ①该方法预测只考虑预测序列本身历史数据反映和包容的信息,实际上是对预测指标历史数量变动规律的进行了整体概括,预测结果可信度高。 ②该预测方法适用于指标数量不大,但预测频度较高的短期预测。

基本步骤: ①数据获取,建立时间序列; ②原始序列预处理,主要包括异常点的辨别,趋势分析和突变点的分析;使其满足平稳性、正态性、零均值性; ③模型识别,简单序列可用前述的趋势模型和季节模型加上误差来进行拟合。 对于平稳时间序列,可用ARMA类模型拟合。 对于非平稳时间序列则转化为平稳时间序列,再用适当模型去拟合这个差分序列。

 Box-Jenkins时间序列建模的基本方法。  第一阶段初步选择适当的模型。  第二阶段包括根据资料对该模型进行判断,如不恰当则返回第一阶段,选择另一模型进行试验。  第三阶段,基于该模型进行预测。

6.2 实例分析   以表3.1中的上海市1995~1999各月的GDP资料进行分析。

6.2.1 消除长期趋势

将原始序列减去长期趋势,可获得新序列。

6.2.2 自相关函数和偏自相关函数   新序列分别计算自相关函数和偏自相关函数(图3.5和图3.6),显示均表现出拖尾性质(呈指数衰减),同时在滞后12,24和36个月时显示出较高的峰值。   采用季节性模型ARIMA(p,d,q)(P,D,Q)12。

图3.5 新序列的自相关函数

图3.6 新序列的偏自相关函数

6.2.3 参数估计 确定ARIMA(4,0,1)(1,0,0)12为最佳模型,相应的参数见表3.6。 φ1 .101629 .169057 参数值 渐近 标准差 95% 置信度下界 φ1 .101629 .169057 -.237311 .440569 φ2 .682851 .000000 φ3 -.109373 φ4 .309327 θ1 -.073956 .233325 -.541745 .393832 Φ1 0.877498 0.086334 10.16404 3.83E-14

模型形式为: 将参数代入即得: (3.88) 整理可得:  此即:

第40至60个月的拟合结果相关系数(r)达0.935