第一章 序列的统计量、检验和分布 EViews提供序列的各种统计图、统计方法及过程。当用前述的方法向工作文件中读入数据后,就可以对这些数据进行统计分析和图表分析。 EViews可以计算一个序列的各种统计量并可用表、图等形式将其表现出来。视图包括最简单的曲线图,一直到核密度估计。
打开工作文件,双击一个序列名,即进入序列的对话框。单击“view”可看到菜单分为四个区,第一部分为序列显示形式,第二和第三部分提供数据统计方法,第四部分是转换选项和标签。
§1.1 描述统计量 以直方图显示序列的频率分布。直方图将序列的长度按等间距划分,显示观测值落入每一个区间的个数。 §1.1 描述统计量 以直方图显示序列的频率分布。直方图将序列的长度按等间距划分,显示观测值落入每一个区间的个数。 同直方图一起显示的还有一些标准的描述统计量。这些统计量都是由样本中的观测值计算出来的。如图(例1.1):
例1.3中GDP增长率的统计量:
均值 (mean) 即序列的平均值,用序列数据的总和除以数据的个数。 中位数 (median) 即从小到大排列的序列的中间值。是对序列分布中心的一个粗略估计。 最大最小值 (max and min) 序列中的最大最小值。 标准差(Standard Deviation) 标准差衡量序列的离散程度。计算公式如下 N 是样本中观测值的个数, 是样本均值。
偏度(Skewness) 衡量序列分布围绕其均值的非对称性。计算公式如下 是变量方差的有偏估计。如果序列的分布是对称的,S值为0;正的S值意味着序列分布有长的右拖尾,负的S值意味着序列分布有长的左拖尾。例1.1中X的偏度为0,说明X的分布是对称的;而例1.3中GDP增长率的偏度是0.78,说明GDP增长率的分布是不对称的。
峰度(Kurtosis) 度量序列分布的凸起或平坦程度,计算公式如下 ,正态分布的 K 值为3。如果 K 值大于3, 意义同S中 分布的凸起程度大于 正态分布;如果K值小于3,序列分布相对于正态分布是平坦的。例1.1中X的峰度为2.5,说明X的分布相对于正态分布是平坦的;而例1.3中GDP增长率的峰度为2.14 ,说明GDP增长率的分布相对于正态分布也是平坦的。
Jarque-Bera 检验 检验序列是否服从正态分布。统计量计算公式如下 S为偏度,K为峰度,k是序列估计式中参数的个数。 在正态分布的原假设下,J-B统计量是自由度为2的 2 分布。 J-B统计量下显示的概率值(P值)是J-B统计量超出原假设下的观测值的概率。如果该值很小,则拒绝原假设。当然,在不同的显著性水平下的拒绝域是不一样的。例1.1中X的J-B统计量下显示的概率值(P值)是0.92,接受原假设, X 服从正态分布;而例1.3中GDP增长率的的J-B统计量的概率值(P值)是0.455 ,也接受原假设, 说明GDP增长率服从正态分布。
§1.2 均值、中位数、方差的假设检验 这部分是对序列均值、中位数、方差的假设检验。在序列对象菜单选择View/tests for descriptive stats/simple hypothesis tests,就会出现下面的序列分布检验对话框:
1. 均值检验 原假设是序列 x 的期望值 m ,备选假设是 ≠m ,即 如果不指定序列 x 的标准差,EViews将在 t – 统计量中使用该标准差的估计值 s 。 是 x 的样本估计值,N是x的观测值的个数。在原假设下,如果x服从正态分布,t 统计量是自由度为N-1的t分布。
如果给定x的标准差,EViews计算t 统计量: 要进行均值检验,在Mean内输入 值。如果已知标准差,想要计算t统计量,在右边的框内输入标准差值。可以输入任何数或标准EViews表达式,下页我们给出检验的输出结果。
这是检验例1.7中GDP增长率的均值,检验H0:X=10%,H1:X≠10%。表中的Probability值是P值(边际显著水平)。在双边假设下,如果这个值小于检验的显著水平,如0.05则拒绝原假设。这里我们不能拒绝原假设。
2. 方差检验 检验的原假设为序列 x 的方差等于 2,备选假设为双边的,x 的方差不等于 2 ,即 EViews计算2统计量,计算公式如下 N为观测值的个数, 为x的样本均值。在原假设下,如果x服从正态分布, 2 统计量是服从自由度为N-1的 2分布。 要进行方差检验,在Variance处填入在原假设下的方差值。可以填入任何正数或表达式。
3. 中位数检验 原假设为序列x的中位数等于m,备选假设为双边假设,x的中位数不等于m,即 EViews提供了三个以排序为基础的无参数的检验统计量。方法的主要参考来自于Conover(1980)和Sheskin(1997)。 进行中位数检验,在Median右边的框内输入中位数的值,可以输入任何数字表达式。
§1.3 分布函数 EViews提供了几种对数据进行初步分析的方法。在§1.1 我们已列出了几种图来描述序列分布特征。在本节,列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。 这些图包含着复杂计算和大量的特殊操作,对某些完全技术性的介绍,不必掌握所有细节。EViews中设置的缺省值除了对极特殊的分析外,对一般分析而言是足够用的。直接点击ok键接受缺省设置,就可以轻松的展现出每个图。
1. CDF—Survivor—Quantile图 本节列出了三种描述序列经验分布特征的图。 1. CDF—Survivor—Quantile图 这个图描绘出带有加或减两个标准误差带的经验累积分布函数,残存函数和分位数函数。在序列菜单中或组菜单中选择View /Distribution/ CDF—Survivor—Quantile…时 ( 组菜单的Multiple Graphs中),就会出现下面的对话框:
Survivor(残存)操作用来描绘序列的经验残存函数 其中,Cumulative Distribution(累积分布)操作用来描绘序列的经验累积函数(CDF)。CDF是序列中观测值不超过指定值 r 的概率 Survivor(残存)操作用来描绘序列的经验残存函数
Quantile(分位数) 操作用来描绘序列的经验分位数。对 0 q 1, X 的分位数 x(q) 满足下式: ,且 分位数函数是CDF的反函数,可以通过调换CDF的横纵坐标轴得到。 All选项包括CDF,Survivor和Quantile函数。 Saved matrix name可以允许把结果保存在一个矩阵内。 Include standard errors(包括标准误差)操作标绘接近95%的置信区间的经验分布函数。
工作文件1_3.wf1中GDP增长率的分布图
2. Quantile—Quantile图 Quantile—Quantile ( QQ图)对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则QQ图将在一条直线上。如果QQ图不在一条直线上,则这两个分布是不同的。 当选择View/Distribution Graphs/Quantile-Quantile….下面的QQ Plot对话框会出现:
可以选与如下的理论分布的分位数相比较: Normal(正态)分布:钟形并且对称的分布. Uniform(均匀)分布:矩形密度函数分布. Exponential(指数)分布:联合指数分布是一个有着一条长右尾的正态分布. Logistic(逻辑)分布:除比正态分布有更长的尾外是一种近似于正态的对称分布. Extreme value(极值)分布:I型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布. 可以在工作文件中选择一些序列来与这些典型序列的分位数相比较,也可以在编辑框中键入序列或组的名称来选择对照的序列或组,EViews将针对列出的每个序列计算出QQ图。
下图是GDP增长率和指数分布的Q-Q图:
3. Kernel Density(核密度) 这个视图标绘出序列分布的核密度估计。一个序列的分布的最简单非参数密度估计是直方图。通过选View/ Descriptive Statistics/Histogram and Stats可以得到直方图,直方图对原点的选择比较敏感并且是不连续的。下图是GDP增长率序列分布的直方图:
核密度估计用“冲击”代替了直方图中的“框”,所以它是平滑的。平滑是通过给远离被估计的点的观测值以小的权重来达到的。 一个序列 X 在点 x 的核密度估计为: 这里,N是观测值的数目,h是带宽(或平滑参数),K是合并为一体的核函数。
当选View/Distribution Graphs/Kernel Density……会出现下面的核密度对话框:
1、Kernel(核) 核函数是一个加权函数,它决定冲击的形状.Eviews针对核函数K提供如下操作: Epanechnikov(default) Triangular Uniform(Rectangular) Normal(Gaussian) Biweight(Quartic) Triweight Cosinus 这里u是核函数的辐角,I (.)是指示函数,辐角为真时,它取1,否则取0。
§1.4 相关矩阵及协方差矩阵 在组中可以显示了组中各序列的相关矩阵及协方差矩阵。Common Sample使任何缺数据的序列都被排除在相关及协方差计算之外。 Pairwise Samples用相关序列的所有无丢失观察值计算。此方法使用样本的最大数,但可能导致不确定矩阵。
§1.5 交叉相关 交叉相关(Cross correlation and Correligrams) §1.5 交叉相关 交叉相关(Cross correlation and Correligrams) 显示组中头两个序列的交叉相关。序列 X 与 Y 的交叉相关的计算公式如下: 注意与自相关不同,交叉相关不必围绕滞后期对称。交叉相关图中的虚线是二倍的标准差,近似计算。
居民消费(CS)和GDP的交叉相关系数