第九章 应用于序列和组的统计图 Eviews提供了几种对数据进行初步分析的方法。在第七章我们已列出了几种图来描述序列分布特征。在本章,列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。 这些图包含着复杂计算和大量的特殊操作,这些将在下面详细论述。对某些完全技术性的介绍,你不必掌握所有细节。Eviews中设置的缺省值除了对极特殊的分析外,对一般分析而言是足够的用的。直接点击ok键接受缺省设置,就可以轻松的展现出每个图。

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

3 的倍数特征 抢三十

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
第一章 序列的统计量、检验和分布 EViews提供序列的各种统计图、统计方法及过程。当用前述的方法向工作文件中读入数据后,就可以对这些数据进行统计分析和图表分析。 EViews可以计算一个序列的各种统计量并可用表、图等形式将其表现出来。视图包括最简单的曲线图,一直到核密度估计。
§3.4 空间直线的方程.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第二节 描述性统计量及检验 2.1. 描述性统计量 随机变量的期望:  =E(X) 随机变量的方差: 2=E[(X- )2]
第四节 对数留数与辐角原理 一、对数留数 二、辐角原理 三、路西定理 四、小结与思考.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
探索三角形相似的条件(2).
在PHP和MYSQL中实现完美的中文显示
Introduction To Mean Shift
拓展 问题 探究 练习 北师大版 五年级上册 第五单元 分数的意义 绿色圃中小学教育网
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
计算机数学基础 主讲老师: 邓辉文.
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
本节内容 平行线的性质 4.3.
第8章 静电场 图为1930年E.O.劳伦斯制成的世界上第一台回旋加速器.
使用矩阵表示 最小生成树算法.
SOA – Experiment 2: Query Classification Web Service
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
iSIGHT 基本培训 使用 Excel的栅栏问题
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
空间平面与平面的 位置关系.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第七、八次实验要求.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
2019/5/21 实验一 离散傅立叶变换的性质及应用 实验报告上传到“作业提交”。 11:21:44.
概率论与数理统计B.
2.3.运用公式法 1 —平方差公式.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
异分母分数加、减法.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
第8章 创建与使用图块 将一个或多个单一的实体对象整合为一个对象,这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时,图块作为一个独立的、完整的对象进行操作,可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.
第四章 UNIX文件系统.
位似.
数学模型实验课(二) 最小二乘法与直线拟合.
§4.5 最大公因式的矩阵求法( Ⅱ ).
第二次课后作业答案 函数式编程和逻辑式编程
一元一次方程的解法(-).
学习目标 1、什么是列类型 2、列类型之数值类型.
9.3多项式乘多项式.
Presentation transcript:

第九章 应用于序列和组的统计图 Eviews提供了几种对数据进行初步分析的方法。在第七章我们已列出了几种图来描述序列分布特征。在本章,列出了几种散点图且允许我们可以用有参数或无参数过程来做拟合曲线图。 这些图包含着复杂计算和大量的特殊操作,这些将在下面详细论述。对某些完全技术性的介绍,你不必掌握所有细节。Eviews中设置的缺省值除了对极特殊的分析外,对一般分析而言是足够的用的。直接点击ok键接受缺省设置,就可以轻松的展现出每个图。

§9.1 序列分布图 §9.1.1 CDF—Surivor—Quantile图 本节列出了三种描述序列经验分布特征的图。 §9.1 序列分布图 本节列出了三种描述序列经验分布特征的图。 §9.1.1 CDF—Surivor—Quantile图 这个图描绘出带有加或减两个标准误差带的经验累积分布函数,残存函数和分位数函数。在序列菜单中或组菜单中选择View /Distribution/ CDF—Surivor—Quantile…时(组菜单的Multiple Graphs中) ,就会出现右面的对话框: 其中,Cumulative Distribution(累积分布)操作用来描绘序列的经验累积函数(CDF)。CDF是序列中观测值不超过指定值r的概率 Surivor(残存)操作用来描绘序列的经验残存函数

Quantile(分位数)操作用来描绘序列的经验分位数。对 的分位数 满足下式: ,且 分位数函数是CDF的反函数,可以通过调换CDF的横纵坐标轴得到。 All选项包括CDF,Survivor和Quantile函数。 Saved matrix name可以允许把结果保存在一个矩阵内。 Include standard errors(包括标准误差)操作标绘接近95%的置信区间的经验分布函数。

Options键提供了几种计算经验CDF的方法: 给定N个观测值,针对r的(CDF)被估计为: (1)Rankit(缺省) (2)Ordinary (3)Van der Waerden (4)Blom (5)Tukey 这几种方法的不同之处在于它们如何调整针对CDF计算的非连续性,这种区别将随样本数的增加而变得微不足道。

§9.1.2 Quantile—Quantile图 Quantile—Quantile ( QQ图)对于比较两个分布是一种简单但重要的工具。这个图标绘出一个被选序列的分位数分布相对于另一个序列的分位数分布或一个理论分布的异同。如果这两个分布是相同的,则QQ图将在一条直线上。如果QQ图不在一条直线上,则这两个分布是不同的。 当选择View/Distribution Graphs/Quantile-Quantile….下面的QQ Plot对话框会出现:

可以选与如下的理论分布的分位数相比较: Normal(正态)分布:钟形并且对称的分布. Uniform(一致)分布:矩形密度函数分布. Exponential(指数)分布:联合指数分布是一个有着一条长右尾的正态分布. Logistic(逻辑)分布:除比正态分布有更长的尾外是一种近似于正态的对称分布. Extreme value(极值)分布:I型极小值分布是有一条左长尾的负偏分布,它非常近似于对数正态分布. 可以在工作文件中选择一些序列来与这些典型序列的分位数相比较,也可以在编辑框中键入序列或组的名称来选择对照的序列或组,Eviews将针对列出的每个序列计算出QQ图。 Options钮提供计算经验分位数函数的几种方法。这与上面在CDF-Survivor-Quantile中相一致,除非样本非常小,几种方法的区别将随样本数的增加而变得微不足道。

§9.1.3 Kernel Density(核密度) 这个视图标绘出序列分布的核密度估计。一个序列的分布的最简单非参数密度估计是直方图。你通过选View/Desctriptive Statistics/Histogram and Stats可以得到直方图,直方图对原点的选择比较敏感并且是不连续的。 核密度估计用“冲击”代替了直方图中的“框”,所以它是平滑的。平滑是通过给远离被估计的点的观测值以小的权重来达到的。 一个序列X在点x的核密度估计是靠下式: 这里,N是观测值的数目,h是带宽(或平滑参数),K是合并为一体的核函数。

当你选View/Distribution Graphs/Kernel Density……会出现下面的核密度对话框: 要展现核密度估计,你需要指定如下几项:

1、Kernel(核) 核函数是一个加权函数,它决定冲击的形状。Eviews针对核函数K提供如下操作: Epanechnikov(default) Triangular Uniform(Rectangular) Normal(Gaussian) Biweight(Quartic) Triweight Cosinus 这里u是核函数的辐角,I (.)是指示函数,辐角为真时,它取1,否则取0。

2、Bandwidth(带宽) 带宽h控制密度估计的平滑程度;带宽越大,估计越平滑。带宽的选取在密度估计中非常重要,Silverman操作(缺省设置)是一种基于数据的自动带宽, 这里N是观测值的数目;S是标准离差;R是序列的分位数间距;因子k是标准带宽变换,标准带宽变换用来调整带宽以便对不同的核函数自动密度估计有大致相当的平滑。 也可以自定带宽,先点击User Specified,在下面的对话框中键入一个非负数。 Bracket Bandwith(括号带宽)操作可以让你研究针对带宽变化所得到的估计的敏感程度。如选这项,相当于给出0.5h,h,1.5h三项带宽。

Number Points(点数) 为估计密度函数,必须给出点数M,缺省设置M=100点。设最大最小值为XUXL,在M个等间距点中估计出 Method(方式)缺省时,Eviews采用Linear Binning(线性单元)近似算法规则系统去限制在计算密度估计中所需要估计的点的数目。对大样本来说,计算量的减少是可观的 。 除非有特殊原因或样本非常小,一般情况下要求使用Linear Binning 算法。 Saved matrix name(保存矩阵名)这一项的作用是用矩阵保存结果。

§9.2 带有拟合线的散点图 通过view/Graph/Scatter打开一个组的视图菜单包括四种散点图。 §9.2 带有拟合线的散点图 通过view/Graph/Scatter打开一个组的视图菜单包括四种散点图。 §9.2.1 Simple Scatter(简单散点图) 其第一个序列在水平轴上,其余的在纵轴上。 §9.2.2 Scatter with Regression(回归散点图) 在组中对第一个序列及第二个序列进行总体变换来进行二元回归,选择Regression后出现对话框:

下面是针对二元拟合的序列变换: None Logarithmic Inverse Power Box-Cox Polynomial 在编辑框中来指定参数a,b。 如果变换是不可以的,会出现错误提示,对多项式(Polynomial)的阶数定的过高。Eviews会自动降低阶数以避免共线性。 点击ok后,Eviews拟合出一条回归线,可以在Fitted Y series编辑框中键入一个名称保存这个拟合的序列。

Robustness lterations(稳健叠代) 最小二乘法对一些无关观测值的存在非常敏感,稳健叠代操作就是产生一种对残差平方的加权形式,使无关的观测值在估计参数时被加最小的权数。 这里 是变形后的序列,权值r通过下式得到: ,m是 的中间数,大的残差的观测值给一个小权数。选择叠代次数应是一个整数。

§9.2.3 Scatter with Nearest Neighber Fit(最邻近拟合散点图) 这是一种带宽基于最邻近点的局部回归。简而言之,对样本中的每一数据点,它拟合出一条局部的并经加权的回归线。局部是说只用邻近点也就是样本的子集来一步步回归,加权是说邻近点越远给越小的权数。当你选择后,会出现如下的对话框:

1.Method 操作 可以选择在样本中的每一个数据点作局部回归或在数据点的子集中作局部回归。 ·Exact(full sample) 在样本中的每一数据点都作局部回归 ·Cleveland subsampling 在选取的子样本中进行回归,可以在编辑框中键入子样本的大小。 作回归实际上不是在样本每点都作,实际计算的点数非常接近于M。这里隐含着这样的原因,选用子样本回归不会丢失信息,因为特别邻近点的回归值几乎没有差别。

2.Specification (说明操作) (1)Bandwidth span(带宽范围) 用来决定在局部回归中应包括哪些观测值,你可以选取在0,1之间的一个数α。 带宽控制拟合线的平滑程度,分数α越大拟合线越平滑。这个分数α指示Eviews在给定点使用[αN]个观测值做局部回归,[αN]是总样本个数的100α%,再取整。 注意标准的最邻近定义意味着被估计点周围点的个数不必是对称的。如果想对称,就选Symmetric neighbors。 (2)Polynomial degree(多项式次数) 制定多项式的次数来拟合每一局部回归 如果选择Bracket bandwidth span(分类带宽)操作,Eviews将显示出带宽为0.5α, α,1.5α的三种最邻近拟合。

(1)Local weighting (Tricube)局部加权 (3) 固定带宽 如果你选择了Bracket bandwidth span,那么Eviews将给三个序列在你定的名称后自动分别加上L,M,N并把它们存起来,它们的带宽分别为0.5α,α和1.5α。 3.其他操作 (1)Local weighting (Tricube)局部加权 给每个局部回归的观测值加权,加权回归使残差平方和最小 三次方权重通过下式是给出: 这里 , 是距该样本点最近的第 个点距样本点的距离。如果你不做选择,将默认 =1。

(2)Robustness Iterations(稳健叠代) 通过调整权数去降低远离的观测值的权重来叠代局部回归。最初的拟合用权数wi , 若你选择了Local weighting 则ωi为3次,否则为1。来自最初拟合的残差ei,被用来计算权数ri,在第二次叠代中,局部拟合用权数ωiri。我们重复这个过程直到我们选定的叠代次数,在每次叠代里,稳健权数ri都通过来自上次叠代的残差来重新计算。 (3)Symmetric Neighbors(对称邻近) 使被估计点的两侧有相同数目的观测值。 可以在Fitted series(拟合序列)框中键入一名称来储存拟合值为一序列。

§9.2.4 Scatter with Kernel Fit(核拟合分布) 这也是一种局部回归拟合,不过是无参数的。另外与最邻近回归拟合相比,区别主要体现在局部带宽的选取上。最邻近拟合的有效带宽可以有很多种,而核拟合则固定带宽且局部的观测值通过核函数来加权。 局部核回归拟合通过选取参数β使加权残差平方和最小。 N是观测值的个数,h是带宽(或光滑参数),K是核函数。 注意:对于不同的 ,β的估计值不同。

打开Scatter with kernel fit,出现下面的对话框: Regression用来指定局部回归的形式,指定多项式的阶数k。Nadaraya-Watson操作设置k=0。 Local linear操作设置k=1。对于高阶多项式,应使用 Local polynomial 操作,可在下面编辑框中输入k的值。

在这里I是指示器,1表示真,2表示假。h带宽决定每个局部回归的观测值的权数。越大越平滑。 Kernel用来定义核函数,这里的核函数用来在每个局部回归中给观测值加权,对核函数的操作前面已经介绍过。核心函数如下: Epanechnikov(default) Triangular Uniform(Rectangular) Normal(Gaussian) Biweight(Quartic) Triweight Cosinus 在这里I是指示器,1表示真,2表示假。h带宽决定每个局部回归的观测值的权数。越大越平滑。

Method 与核分布中介绍相一致,也分为精确和线性单元两种方式。 Bandwidth在这里,Eviews自动设立带宽 , 是X的范围。也可以点击User Specified,在下面的编辑框中自己设置一个带宽。 Bracket Bandwidth(固定带宽)即用带宽分别为0.5h,h,1.5h来做3个核密度回归。 Number of grid points (分区点数) 指定一个点数M(缺省值是100),假设序列X的样本值范围是 ,则在如下点进行多元回归估计: Method 与核分布中介绍相一致,也分为精确和线性单元两种方式。 Fitted series 可以在编辑框中给拟合后序列起名,然后存起来。 Bracket Bandwidth 即为0.5α,α,1.5α,还是分别以“_ L”, “ _M ”, “ _H ”做后缀。

§9.3 函数命令 返回 lwage.cdfplot(a) 表示对序列LWAGE做CDF,quantile和survive函数。 §9.3 函数命令 lwage.cdfplot(a) 表示对序列LWAGE做CDF,quantile和survive函数。 lwage.kdensity(k=n) 表示对序列LWAGE做核密度估计,核函数用正态,带宽自动选取。 Lwage.kdensity(k=e, b=.25)表示对序列做核密度估计,核函数操作选缺省项,带宽为0.25,并且为加括号带宽。 group aa lwage age aa.linefit (yl, xl) 表示建立一个组包括序列LWAGE和AGE,再经过对两个序列的对数变换然后进行回归拟合。 aa.linefit(yl, d=3) 对Y轴上的序列经对数变换,且次数取3来拟合X轴上的序列。 aa.nnfit表示在组aa中进行最邻近点拟合。 aa.kerfit表示在组aa中进行核拟合。 返回