第三章 平稳时间序列分析.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第九章 常微分方程数值解法 §1 、引言. 微分方程的数值解:设方程问题的解 y(x) 的存在区间是 [a,b] ,令 a= x 0 < x 1
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第 4 章 数值微积分. 4.1 内插求积 Newton-Cotes 公式 第 4 章 数值微积分 4.1 内插求积 Newton-Cotes 公式.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第六章 动态模型.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
第五章 平稳时间序列预测 设当前时刻为t,我们已经知道平稳时间序列Xt在时刻t 及以前时刻的观察值Xt ,Xt-1,Xt-2… ,现在用序列Xt对时刻t以后的观察值Xt+l(l>0)进行预测。这种预测称为以t 为原点,向前步长为l的预测,预测值记为.
«地学建模» 之 “随机时间序列分析模型”.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
3.2.平稳性检验的单位根方法 单位根检验方法 DF检验 ADF检验 PP检验 KPSS检验 ERS检验 NP检验.
第五章 非平稳序列的随机分析.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
第9章 平稳时间序列分析.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第四章 非平稳序列的确定性分析.
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
ARIMA模型在电量预测中的应用 蔡跳
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
§3.7 热力学基本方程及麦克斯韦关系式 热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算
清华大学自动化系 张贤达 电话: 第三章 现代谱估计 清华大学自动化系 张贤达 电话:
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第六章 多元时间序列分析.
7 平稳时间序列预测法 7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模 回总目录.
第六章 多元时间序列分析.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学统计学系.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
EM算法 一种参数估计的方法.
第五章 非平稳序列的随机分析.
第十章 方差分析.
数据挖掘工具性能比较.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 两变量线性回归.
第四章 多元线性回归分析.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第三章 平稳时间序列分析.
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

第三章 平稳时间序列分析

本章结构 ARMA模型 平稳序列建模 序列预测

3.1 ARMA模型的性质 AR模型(Auto Regression Model) MA模型(Moving Average Model) ARMA模型(Auto Regression Moving Average model)

AR模型的定义 具有如下结构的模型称为 阶自回归模型,简记为 特别当 时,称为中心化 模型

AR(P)序列中心化变换 称 为 的中心化序列 ,令

自回归系数多项式 引进延迟算子,中心化 模型又可以简记为 自回归系数多项式

AR模型平稳性判别 判别原因 AR模型是常用的平稳序列的拟合模型之一,但并非所有的AR模型都是平稳的 判别方法 单位根判别法 平稳域判别法

例3.1:考察如下四个模型的平稳性

e<-rnorm(1000) x1=e;x2=e;x3=e;x4=e for(i in 3:1000) {x1[i]=0.8*x1[i-1]+e[i] x2[i]=-1.1*x2[i-1]+e[i] x3[i]=x3[i-1]-0.5*x3[i-2]+e[i] x4[i]=x4[i-1]+0.5*x4[i-2]+e[i] }

par(mfrow=c(2,2)) ts.plot(x1) ts.plot(x2) ts.plot(x3) ts.plot(x4)

例3.1平稳序列时序图

例3.1非平稳序列时序图

AR模型平稳性判别方法 特征根判别 平稳域判别 平稳域 AR(p)模型平稳的充要条件是它的p个特征根都在单位圆内 根据特征根和自回归系数多项式的根成倒数的性质,等价判别条件是该模型的自回归系数多项式的根都在单位圆外 平稳域判别 平稳域

AR(1)模型平稳条件 特征根 平稳域

AR(2)模型平稳条件 特征根 平稳域

例3.1平稳性判别 模型 特征根判别 平稳域判别 结论 (1) 平稳 (2) 非 (3) (4)

平稳AR模型的统计性质 均值 方差 协方差 自相关系数 偏自相关系数

均值 如果AR(p)模型满足平稳性条件,则有 根据平稳序列均值为常数,且 为白噪声序列,有 推导出

Green函数定义 AR模型的传递形式 其中系数 称为Green函数

Green函数递推公式 原理 方法 待定系数法 递推公式

方差 平稳AR模型的传递形式 两边求方差得

例3.2:求平稳AR(1)模型的方差 平稳AR(1)模型的传递形式为 Green函数为 平稳AR(1)模型的方差

协方差函数 在平稳AR(p)模型两边同乘 ,再求期望 根据 得协方差函数的递推公式

例3.3:求平稳AR(1)模型的协方差 递推公式 平稳AR(1)模型的方差为 协方差函数的递推公式为

例3.4:求平稳AR(2)模型的协方差 平稳AR(2)模型的协方差函数递推公式为

自相关系数 自相关系数的定义 平稳AR(P)模型的自相关系数递推公式

常用AR模型自相关系数递推公式 AR(1)模型 AR(2)模型

AR模型自相关系数的性质 拖尾性 呈复指数衰减

par(mfrow=c(2,2)) acf(x1) acf(x2) acf(x3) acf(x4)

例3.5— 自相关系数按复指数单调收敛到零

例3.5:—

例3.5:考察如下AR模型的自相关图

例3.5:— 自相关系数呈现出“伪周期”性

例3.5:— 自相关系数不规则衰减

偏自相关系数 定义 对于平稳AR(p)序列,所谓滞后k偏自相关系数就是指在给定中间k-1个随机变量 的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后, 对 影响的相关度量。用数学语言描述就是

偏自相关系数的计算 滞后k偏自相关系数实际上就等于k阶自回归模型第k个回归系数的值。

偏自相关系数的截尾性 AR(p)模型偏自相关系数P阶截尾

par(mfrow=c(2,2)) pacf(x1) pacf(x2) pacf(x3) pacf(x4)

例3.5续:考察如下AR模型的偏自相关图

例3.5— 理论偏自相关系数 样本偏自相关图

例3.5:— 理论偏自相关系数 样本偏自相关图

例3.5:— 理论偏自相关系数 样本偏自相关图

例3.5:— 理论偏自相关系数 样本偏自相关系数图

MA模型的定义 具有如下结构的模型称为 阶自回归模型,简记为 特别当 时,称为中心化 模型

移动平均系数多项式 引进延迟算子,中心化 模型又可以简记为 阶移动平均系数多项式

MA模型的统计性质 常数均值 常数方差

MA模型的统计性质 自协方差函数P阶截尾 自相关系数P阶截尾

常用MA模型的自相关系数 MA(1)模型 MA(2)模型

MA模型的统计性质 偏自相关系数拖尾

例3.6:考察如下MA模型的相关性质

e<-rnorm(1000) x1=e;x2=e;x3=e;x4=e for(i in 3:1000) {x1[i]=e[i]-2*e[i-1] x2[i]=e[i]-0.5*e[i-1] x3[i]=e[i]-4/5*e[i-1]+16/25*e[i-2] x4[i]=e[i]-5/4*e[i-1]+25/16*e[i-2] }

par(mfrow=c(2,2)) ts.plot(x1) ts.plot(x2) ts.plot(x3) ts.plot(x4)

par(mfrow=c(2,2)) acf(x1) acf(x2) acf(x3) acf(x4)

par(mfrow=c(2,2)) pacf(x1) pacf(x2) pacf(x3) pacf(x4)

MA模型的自相关系数截尾

MA模型的自相关系数截尾

MA模型的偏自相关系数拖尾

MA模型的偏自相关系数拖尾

MA模型的可逆性 MA模型自相关系数的不唯一性 例3.6中不同的MA模型具有完全相同的自相关系数和偏自相关系数

可逆的定义 可逆MA模型定义 可逆概念的重要性 若一个MA模型能够表示称为收敛的AR模型形式,那么该MA模型称为可逆MA模型

可逆MA(1)模型

MA模型的可逆条件 MA(q)模型的可逆条件是: MA(q)模型的特征根都在单位圆内 等价条件是移动平滑系数多项式的根都在单位圆外

逆函数的递推公式 原理 方法 待定系数法 递推公式

例3.6续:考察如下MA模型的可逆性

(1)—(2) 逆函数 逆转形式

(3)—(4) 逆函数 逆转形式

ARMA模型的定义 具有如下结构的模型称为自回归移动平均模型,简记为 特别当 时,称为中心化 模型

系数多项式 引进延迟算子,中心化 模型又可以简记为 阶自回归系数多项式 阶移动平均系数多项式

平稳条件与可逆条件 ARMA(p,q)模型的平稳条件 ARMA(p,q)模型的可逆条件 P阶自回归系数多项式 的根都在单位圆外

传递形式与逆转形式 传递形式 逆转形式

ARMA(p,q)模型的统计性质 均值 协方差 自相关系数

ARMA模型的相关性 自相关系数拖尾 偏自相关系数拖尾

例3.7:考察ARMA模型的相关性 拟合模型ARMA(1,1): 并直观地考察该模型自相关系数和偏自相关系数的性质。

e<-rnorm(1000) x5=e for(i in 3:1000) x5[i]=0.5*x5[i-1]+e[i]-0.8*e[i-1] par(mfrow=c(2,2)) ts.plot(x5) acf(x5);pacf(x5)

自相关系数和偏自相关系数拖尾性 样本自相关图 样本偏自相关图

ARMA模型相关性特征 模型 自相关系数 偏自相关系数 AR(P) 拖尾 P阶截尾 MA(q) q阶截尾 ARMA(p,q)

3.3平稳序列建模 建模步骤 模型识别 参数估计 模型检验 模型优化 序列预测

建模步骤 平 稳 非 白 噪 声 序 列 计 算 样 本 相 关 系 数 模型 识别 参数 估计 模 型 优 化 序 列 预 测 模型 检验 N Y

计算样本相关系数 样本自相关系数 样本偏自相关系数

模型识别 基本原则 选择模型 拖尾 P阶截尾 AR(P) q阶截尾 MA(q) ARMA(p,q)

模型定阶的困难 因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的 或 仍会呈现出小值振荡的情况 因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的 或 仍会呈现出小值振荡的情况 由于平稳时间序列通常都具有短期相关性,随着延迟阶数 , 与 都会衰减至零值附近作小值波动 ?当 或 在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?

样本相关系数的近似分布 Barlett Quenouille

模型定阶经验方法 95%的置信区间 模型定阶的经验方法 如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。

例2.5续 选择合适的模型ARMA拟合1950年——1998年北京市城乡居民定期储蓄比例序列。

x<-scan() 83.5 63.1 71 76.3 70.5 80.5 73.6 75.2 69.1 71.4 78.8 84.4 84.1 83.3 83.1 81.6 81.4 84 82.9 83.2 82.2 83.8 84.5 84.8 83.9 81 82.7 82.3 80.9 80.3 81.3 83.4 88.2 89.6 90.1 87 88.3 87.8 84.7 80.2

par(mfrow=c(3,1)) ts.plot(x) acf(x) pacf(x)

序列自相关图

序列偏自相关图

拟合模型识别 自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾 偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾 所以可以考虑拟合模型为AR(1)

例3.8 美国科罗拉多州某一加油站连续57天的OVERSHORT序列

x<-scan() 78 -58 53 -63 13 -6 -16 -14 3 -74 89 -48 32 56 -86 -66 50 26 59 -47 -83 2 -1 124 -106 113 -76 -32 39 -30 6 -73 18 -24 23 -38 91 -56 1 14 -4 77 -127 97 10 -28 -17 -2 48 -131 65

par(mfrow=c(3,1)) ts.plot(x) acf(x) pacf(x)

序列自相关图

序列偏自相关图

拟合模型识别 自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾 偏自相关系数显示出典型非截尾的性质。 综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1)

例3.9 1880-1985全球气表平均温度改变值差分序列

x<-scan() -0.4 -0.37 -0.43 -0.47 -0.72 -0.54 -0.39 -0.19 -0.44 -0.49 -0.38 -0.41 -0.27 -0.18 -0.22 -0.03 -0.09 -0.28 -0.36 -0.25 -0.17 -0.45 -0.32 -0.33 -0.29 -0.05 -0.01 -0.26 -0.48 -0.2 -0.15 -0.08 -0.14 -0.13 -0.12 -0.1 0.13 0.06 0.09 0.05 -0.16 -0.02 0.04 0.17 0.19 0.15 0.11 0.03 0.02 0.07 0.2 -0.07 0.01 0.08 -0.04 -0.24 0.12 0.27 0.42 0.3

x<-diff(x) par(mfrow=c(3,1)) ts.plot(x) acf(x) pacf(x)

序列自相关图

序列偏自相关图

拟合模型识别 自相关系数显示出不截尾的性质 偏自相关系数也显示出不截尾的性质 综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)模型拟合该序列

参数估计 待估参数 个未知参数 常用估计方法 矩估计 极大似然估计 最小二乘估计

矩估计 原理 样本自相关系数估计总体自相关系数 样本一阶均值估计总体均值,样本方差估计总体方差

例3.10:求AR(2)模型系数的矩估计 AR(2)模型 Yule-Walker方程 矩估计(Yule-Walker方程的解)

例3.11:求MA(1)模型系数的矩估计 MA(1)模型 方程 矩估计

例3.12:求ARMA(1,1)模型系数的矩估计 ARMA(1,1)模型 方程 矩估计

对矩估计的评价 优点 缺点 通常矩估计方法被用作极大似然估计和最小二乘估计迭代计算的初始值 估计思想简单直观 不需要假设总体分布 计算量小(低阶模型场合) 缺点 信息浪费严重 只用到了p+q个样本自相关系数信息,其他信息都被忽略 估计精度差 通常矩估计方法被用作极大似然估计和最小二乘估计迭代计算的初始值

极大似然估计 原理 在极大似然准则下,认为样本来自使该样本出现概率最大的总体。因此未知参数的极大似然估计就是使得似然函数(即联合密度函数)达到最大的参数值

似然方程 由于 和 都不是 的显式表达式。因而似然方程组实际上是由p+q+1个超越方程构成,通常需要经过复杂的迭代算法才能求出未知参数的极大似然估计值

对极大似然估计的评价 优点 缺点 极大似然估计充分应用了每一个观察值所提供的信息,因而它的估计精度高 同时还具有估计的一致性、渐近正态性和渐近有效性等许多优良的统计性质 缺点 需要假定总体分布

最小二乘估计 原理 使残差平方和达到最小的那组参数值即为最小二乘估计值

条件最小二乘估计 实际中最常用的参数估计方法 假设条件 残差平方和方程 解法 迭代法

对最小二乘估计的评价 优点 缺点 最小二乘估计充分应用了每一个观察值所提供的信息,因而它的估计精度高 条件最小二乘估计方法使用率最高 需要假定总体分布

arima(x, order = c(0, 0, 0), seasonal = list(order = c(0, 0, 0), period = NA), xreg = NULL, include.mean = TRUE, transform.pars = TRUE, fixed = NULL, init = NULL, method = c("CSS-ML", "ML", "CSS"), n.cond, optim.method = "BFGS", optim.control = list(), kappa = 1e6)

例2.5续 确定1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的口径 拟合模型:AR(1) 估计方法:极大似然估计 模型口径

x1<-scan() 83.5 63.1 71 76.3 70.5 80.5 73.6 75.2 69.1 71.4 78.8 84.4 84.1 83.3 83.1 81.6 81.4 84 82.9 83.2 82.2 83.8 84.5 84.8 83.9 81 82.7 82.3 80.9 80.3 81.3 83.4 88.2 89.6 90.1 87 88.3 87.8 84.7 80.2

arima(x1, order = c(1, 0, 0),method = "ML")

例3.8续 确定美国科罗拉多州某一加油站连续57天的OVERSHORTS序列拟合模型的口径 拟合模型:MA(1) 估计方法:条件最小二乘估计 模型口径

x2<-scan() 78 -58 53 -63 13 -6 -16 -14 3 -74 89 -48 32 56 -86 -66 50 26 59 -47 -83 2 -1 124 -106 113 -76 -32 39 -30 6 -73 18 -24 23 -38 91 -56 1 14 -4 77 -127 97 10 -28 -17 -2 48 -131 65

arima(x2,order=c(0,0,1))

例3.9续 确定1880-1985全球气表平均温度改变值差分序列拟合模型的口径 拟合模型:ARMA(1,1) 估计方法:条件最小二乘估计 模型口径

x3<-scan() -0.4 -0.37 -0.43 -0.47 -0.72 -0.54 -0.39 -0.19 -0.44 -0.49 -0.38 -0.41 -0.27 -0.18 -0.22 -0.03 -0.09 -0.28 -0.36 -0.25 -0.17 -0.45 -0.32 -0.33 -0.29 -0.05 -0.01 -0.26 -0.48 -0.2 -0.15 -0.08 -0.14 -0.13 -0.12 -0.1 0.13 0.06 0.09 0.05 -0.16 -0.02 0.04 0.17 0.19 0.15 0.11 0.03 0.02 0.07 0.2 -0.07 0.01 0.08 -0.04 -0.24 0.12 0.27 0.42 0.3

arima(x3,order=c(1,1,1)) x4=diff(x3) arima(x4,order=c(1,0,1))

模型检验 模型的显著性检验 整个模型对信息的提取是否充分 参数的显著性检验 模型结构是否最简

模型的显著性检验 目的 检验对象 判定原则 检验模型的有效性(对信息的提取是否充分) 残差序列 一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列 反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效

假设条件 原假设:残差序列为白噪声序列 备择假设:残差序列为非白噪声序列

检验统计量(ljung-box test) LB统计量 R(Box.test) Box.test (x, lag = 1, type = "Ljung")

例2.5续 检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性 残差白噪声序列检验结果 延迟阶数 LB统计量 P值 检验结论 6 5.83 0.3229 拟合模型显著有效 12 10.28 0.5050 18 11.38 0.8361

x1<-scan() 83.5 63.1 71 76.3 70.5 80.5 73.6 75.2 69.1 71.4 78.8 84.4 84.1 83.3 83.1 81.6 81.4 84 82.9 83.2 82.2 83.8 84.5 84.8 83.9 81 82.7 82.3 80.9 80.3 81.3 83.4 88.2 89.6 90.1 87 88.3 87.8 84.7 80.2

xr1=resid(arima(x1,order=c(1,0,0))) Box.test (xr1, lag = 1, type = "Ljung") Box.test (xr1, lag = 6, type = "Ljung") Box.test (xr1, lag = 12, type = "Ljung") Box.test (xr1, lag = 18, type = "Ljung")

参数显著性检验 目的 检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简 假设条件 检验统计量

例2.5续 检验1950年——1998年北京市城乡居民定期储蓄比例序列极大似然估计模型的参数是否显著 参数检验结果 检验参数 t统计量 P值 结论 均值 46.12 <0.0001 显著 6.72

mar=arima(x1,order=c(1,0,0)) abs(mar$coef)/sqrt(diag(mar$var.coef)) 1-pnorm(abs(mar$coef)/sqrt(diag(mar$var.coef)))

例3.8续:对OVERSHORTS序列的拟合模型进行检验 残差白噪声检验 参数显著性检验 延迟阶数 LB统计量 P值 结论 6 3.15 0.6772 模型显著有效 12 9.05 0.6171 检验参数 t统计量 P值 结论 均值 -3.75 <0.0004 显著 10.60 <0.0001

x2<-scan() 78 -58 53 -63 13 -6 -16 -14 3 -74 89 -48 32 56 -86 -66 50 26 59 -47 -83 2 -1 124 -106 113 -76 -32 39 -30 6 -73 18 -24 23 -38 91 -56 1 14 -4 77 -127 97 10 -28 -17 -2 48 -131 65

mar2=arima(x2,order=c(0,0,1)) xr2=resid(mar2) Box.test (xr2, lag = 6, type = "Ljung") Box.test (xr2, lag = 12, type = "Ljung") 1-pnorm(abs(mar2$coef)/sqrt(diag(mar2$var.coef))) abs(mar2$coef)/sqrt(diag(mar2$var.coef))

例3.9续:对1880-1985全球气表平均温度改变值差分序列拟合模型进行检验 残差白噪声检验 参数显著性检验 延迟阶数 LB统计量 P值 结论 6 5.28 0.2595 模型显著有效 12 10.30 0.4247 检验参数 t统计量 P值 结论 16.34 <0.0001 显著 3.5 0.0007

x3<-scan() -0.4 -0.37 -0.43 -0.47 -0.72 -0.54 -0.39 -0.19 -0.44 -0.49 -0.38 -0.41 -0.27 -0.18 -0.22 -0.03 -0.09 -0.28 -0.36 -0.25 -0.17 -0.45 -0.32 -0.33 -0.29 -0.05 -0.01 -0.26 -0.48 -0.2 -0.15 -0.08 -0.14 -0.13 -0.12 -0.1 0.13 0.06 0.09 0.05 -0.16 -0.02 0.04 0.17 0.19 0.15 0.11 0.03 0.02 0.07 0.2 -0.07 0.01 0.08 -0.04 -0.24 0.12 0.27 0.42 0.3

mar3=arima(x3,order=c(1,1,1)) xr3=resid(mar3) Box.test (xr3, lag = 12, type = "Ljung") Box.test (xr3, lag =6, type = "Ljung") abs(mar3$coef)/sqrt(diag(mar3$var.coef)) 1-pnorm(abs(mar3$coef)/sqrt(diag(mar3$var.coef)))

模型优化 问题提出 当一个拟合模型通过了检验,说明在一定的置信水平下,该模型能有效地拟合观察值序列的波动,但这种有效模型并不是唯一的。 优化的目的 选择相对最优模型

例3.13:拟合某一化学序列

x4<-scan() 1: 47 2: 64 3: 23 4: 71 5: 38 6: 64 7: 55 8: 41 9: 59 10: 48 11: 71 12: 35 13: 57 14: 40 15: 58 16: 44 17: 80 18: 55 19: 37 20: 74 21: 51 22: 57 23: 50 24: 60 25: 45 26: 57 27: 50 28: 45 29: 25 30: 59 31: 50 32: 71 33: 56 34: 74 35: 50 36: 58 37: 45 38: 54 39: 36 40: 54 41: 48 42: 55 43: 45 44: 57 45: 50 46: 62 47: 44 48: 64 49: 43 50: 52 51: 38 52: 59 53: 55 54: 41 55: 53 56: 49 57: 34 58: 35 59: 54 60: 45 61: 68 62: 38 63: 50 64: 60 65: 39 66: 59 67: 40 68: 57 69: 54 70: 23 71:

par(mfrow=c(3,1)) ts.plot(x4) pacf(x4) acf(x4)

mar4=arima(x4,order=c(0,0,2)) xr4=resid(mar4) Box.test (xr4, lag = 6, type = "Ljung") Box.test (xr4, lag = 12, type = "Ljung") 1-pnorm(abs(mar4$coef)/sqrt(diag(mar4$var.coef))) abs(mar4$coef)/sqrt(diag(mar4$var.coef))

mar42=arima(x4,order=c(1,0,0)) xr42=resid(mar42) Box.test (xr42, lag = 6, type = "Ljung") Box.test (xr42, lag = 12, type = "Ljung") 1-pnorm(abs(mar42$coef)/sqrt(diag(mar42$var.coef))) abs(mar42$coef)/sqrt(diag(mar42$var.coef))

序列自相关图

序列偏自相关图

拟合模型一 根据自相关系数2阶截尾,拟合MA(2)模型 参数估计 模型检验 模型显著有效 三参数均显著

拟合模型二 根据偏自相关系数1阶截尾,拟合AR(1)模型 参数估计 模型检验 模型显著有效 两参数均显著

问题 同一个序列可以构造两个拟合模型,两个模型都显著有效,那么到底该选择哪个模型用于统计推断呢? 解决办法 确定适当的比较准则,构造适当的统计量,确定相对最优

AIC准则 最小信息量准则(An Information Criterion) 指导思想 AIC统计量 似然函数值越大越好 未知参数的个数越少越好 AIC统计量

SBC准则 AIC准则的缺陷 在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多 SBC统计量

例3.13续 用AIC准则和SBC准则评判例3.13中两个拟合模型的相对优劣 结果 AR(1)优于MA(2) 模型 AIC SBC 536.4556 543.2011 AR(1) 535.7896 540.2866

mar4$aic mar42$aic

序列预测 线性预测函数 预测方差最小原则

序列分解 预测误差 预测值

误差分析 估计误差 期望 方差

AR(p)序列的预测 预测值 预测方差 95%置信区间

例3.14 已知某超市月销售额近似服从AR(2)模型(单位:万元/每月) 今年第一季度该超市月销售额分别为: 101,96,97.2万元 请确定该超市第二季度每月销售额的95%的置信区间

例3.14解:预测值计算 四月份 五月份 六月份

例3.14解:预测方差的计算 GREEN函数 方差

例3.14解:置信区间 公式 估计结果 预测时期 95%置信区间 四月份 (85.36,108.88) 五月份 (83.72,111.15) 六月份 (81.84,113.35)

例2.5:北京市城乡居民定期储蓄比例序列拟合与预测图

MA(q)序列的预测 预测值 预测方差

例3.15 已知某地区每年常驻人口数量近似服从MA(3)模型(单位:万): 最近3年的常驻人口数量及一步预测数量如下: 预测未来5年该地区常住人口的95%置信区间 年份 统计人数 预测人数 2002 104 110 2003 108 100 2004 105 109

例3.15解:随机扰动项的计算

例3.15解:估计值的计算

例3.15解:预测方差的计算

例3.15解:置信区间的计算 预测年份 95%置信区间 2005 (99,119) 2006 (83,109) 2007 (87,115) 2008 (86,114) 2009

ARMA(p,q)序列预测 预测值 预测方差

例3.16 已知模型为: 且 预测未来3期序列值的95%的置信区间。

例3.16解:估计值的计算

例3.16解:预测方差的计算 Green函数 方差

例3.16解:置信区间的计算 时期 95%置信区间 101 (0.136,0.332) 102 (0.087,0.287) 103 (-0.049,0.251)

修正预测 定义 方法 所谓的修正预测就是研究如何利用新的信息去获得精度更高的预测值 在新的信息量比较大时——把新信息加入到旧的信息中,重新拟合模型 在新的信息量很小时——不重新拟合模型,只是将新的信息加入以修正预测值,提高预测精度

修正预测原理 在旧信息的基础上, 的预测值为 假设新获得一个观察值 ,则 的修正预测值为 修正预测误差为 预测方差为

一般情况 假设新获得p个观察值 ,则 的修正预测值为 修正预测误差为 预测方差为

例3.14续:假如四月份的真实销售额为100万元,求二季度后两个月销售额的修正预测值 计算四月份的预测误差 计算修正预测值 计算修正方差

修正置信区间 预测时期 修正前置信区间 修正后置信区间 四月份 五月份 六月份 (85.36,108.88) (83.72,111.15) (87.40,110.92) 六月份 (81.84,113.35) (85.79,113.21)

par(mfrow=c(3,1)) ts.plot(lh) pacf(lh) acf(lh) lhp=predict(arima(lh, order = c(1,0,0)), n.ahead = 12)