统计学期末复习 2010.11.10.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第 3 章 数据的图表展示 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第六章 回归分析.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
第十章 相关与回归分析 PowerPoint 统计学.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第四章 概率、正态分布、常用统计分布.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第五讲 抽样分布与参数估计.
第二节 描述性统计量及检验 2.1. 描述性统计量 随机变量的期望:  =E(X) 随机变量的方差: 2=E[(X- )2]
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
相关与回归分析 目 录 一 相关分析概述 二 一元线性回归分析 小 结 三.
第 3 章 数据的整理与显示 PowerPoint 统计学.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
第二章 经典单方程计量经济学模型: 一元线性回归模型
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
线性相关分析.
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
区间估计 Interval Estimation.
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第12章 回归直线.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
数据挖掘工具性能比较.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
统计图表绘制 电子工业出版社.
可编辑图表汇总 修改方法: 点击图表内容→“设计”选项卡→编辑数据.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 两变量线性回归.
第四章 多元线性回归分析.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
单样本检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Presentation transcript:

统计学期末复习 2010.11.10

第1章 导论 1.1 统计及其应用领域 1.2 统计数据的类型 1.3 统计中的几个基本概念

统计数据的分类 按计量层次 分类数据 顺序数据 数值型数据 按收集方法 观察数据 试验数据 按时间状况 截 面 数 据 时序数据

统计中的几个基本概念 总体和样本 参数和统计量 变量

第2章 数据的搜集 1. 数据的来源 2. 搜集数据的调查方法 3. 搜集数据的实验方法 4. 数据的误差 5. 数据的质量要求

抽样方法

搜集数据的基本方法

数据的误差

第 3 章 数据的图表展示 3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表

品质数据的整理与显示 分类数据的整理与图示 顺序数据的整理与图示 可计算的统计量:频数、比例、百分比、比率 分类数据的图示:条形图、对比条形图、帕累托图、饼图 顺序数据的整理与图示 可计算的统计量:累积频数、累积频率 顺序数据的图示—累计频数分布图、环形图

数值型数据的整理与展示 数据分组:组距分组、单变量值分组 数值型数据的图示: 分组数据—直方图和折线图(直方图与条形图的区别) 未分组数据—茎叶图和箱线图 时间序列数据—线图 多变量数据的图示 两个变量间的关系—二维散点图 三个变量间的关系—气泡图 多变量数据—雷达图

第 4 章 数据的概括性度量 4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量

数据分布特征和描述统计量

4.1 集中趋势的度量 4.1.1 分类数据:众数 4.1.2 顺序数据:中位数和分位数 4.1.3 数值型数据:平均数 4.1 集中趋势的度量 4.1.1 分类数据:众数 4.1.2 顺序数据:中位数和分位数 4.1.3 数值型数据:平均数 4.1.4 众数、中位数和平均数的比较

众数、中位数、平均数的特点和应用 众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大且有明显峰值时应用 中位数 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用

4.2 离散程度的度量 4.2.1 分类数据:异众比率 4.2.2 顺序数据:四分位差 4.2.3 数值型数据:方差和标准差 4.2 离散程度的度量 4.2.1 分类数据:异众比率 4.2.2 顺序数据:四分位差 4.2.3 数值型数据:方差和标准差 4.2.4 相对离散程度:离散系数

4.3 偏态与峰态的度量 4.3.1 偏态及其测度:偏态系数 4.3.2 峰态及其测度:峰态系数 偏态系数=0为对称分布 4.3 偏态与峰态的度量 4.3.1 偏态及其测度:偏态系数 偏态系数=0为对称分布 偏态系数> 0为右偏分布 偏态系数< 0为左偏分布 4.3.2 峰态及其测度:峰态系数 峰态系数=0扁平峰度适中 峰态系数<0为扁平分布 峰态系数>0为尖峰分布

第 6 章 统计量及其抽样分布 6.1 统计量 6.2 关于分布的几个概念 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 第 6 章 统计量及其抽样分布 6.1 统计量 6.2 关于分布的几个概念 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布 6.7 关于样本方差的分布

样本均值的抽样分布 1. 在重复选取容量为n的样本时,由样本均值 的所有可能取值形成的相对频数分布 2. 一种理论概率分布 2. 一种理论概率分布 推断总体均值的理论基础 当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)

中心极限定理 从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。 当样本容量足够大时(n  30) ,样本均值的抽样分布逐渐趋于正态分布。

样本比例的抽样分布 在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布 当样本容量很大时,样本比例的抽样分布可用正态分布近似 。 样本比例的数学期望 样本比例的方差

第 7 章 参数估计 7.1 参数估计的一般问题 7.2 一个总体参数的区间估计 7.4 样本量的确定

参数估计的一般问题 点估计:用样本的估计量的某个取值直接作为总体参数的估计值 区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到。 置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。 置信区间:由样本统计量所构造的总体参数的估计区间称为置信区间。

一个总体参数的区间估计

总体均值的区间估计 正态总体、2已知,或非正态总体、大样本 正态总体、2未知、小样本

总体比例的区间估计 1. 假定条件 2. 使用正态分布统计量 z 3. 总体比例在1-置信水平下的置信区间为 总体服从二项分布 可以由正态分布来近似 2. 使用正态分布统计量 z 3. 总体比例在1-置信水平下的置信区间为

样本量的确定 估计总体均值时样本量的确定 估计总体比例时样本量的确定 其中:

第 8 章 假设检验 8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.4 假设检验中的其他问题

假设检验的流程 提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策

一个总体参数的检验 Z 检验 (单尾和双尾) t 检验 2检验 均值 一个总体 比例 方差

总体均值的检验(检验统计量) 是 z 检验 样本量n 否 总体 是否已知? z 检验 大 用样本标 准差S代替 t 检验 小

总体均值的检验 (2 已知或2未知大样本) 1. 假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 2. 使用Z-统计量 2 已知: 2 未知:

一个总体比例检验 1. 假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 2. 比例检验的 Z 统计量

原假设与备择假设的确定 一般情况下,原假设为“原有的”、“传统的”观点或结论,被大多数人认可、接受的东西,是不容易否定的命题。 备择假设为人们比较感兴趣的、新的、猜测的、需要验证的命题。 接受备择假设一定意味着原假设错误,而没有拒绝原假设并不能表明备择假设是错的,只是还没有足够的证据推翻原假设。

第11章 一元线性回归 11.1 变量间关系的度量 11.2 一元线性回归 11.3 利用回归方程进行估计和预测

相关分析 变量之间是否存在关系? 如果存在关系,它们之间是什么样的关系? 变量之间的关系强度如何? 样本所反映的变量之间的关系能否代表总体变量之间的关系?

相关系数的性质 性质1:r 的取值范围是 [-1,1] |r|=1,为完全相关 r = 0,不存在线性相关关系 -1r<0,为负相关

相关系数的性质 性质2:r具有对称性。即x与y之间的相关系数和y与x之间 的相关系数相等,即rxy= ryx 性质3:r数值大小与x和y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小 性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着, r=0只表示两变 量之间不存在线性相关关系,并不说明变量之没 有任何关系 性质5:r虽然是两个变量之间线性关系的一个度量,却不 一定意味着x与y一定有因果关系

相关系数的经验解释 1. |r|0.8时,可视为两个变量之间高度相关 2. 0.5|r|<0.8时,可视为中度相关 上述解释必须建立在对相关系数的显著性进行检 验的基础之上

回归分析 1. 从一组样本数据出发,确定变量之间的数学关系式 2. 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 3. 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度

相关分析与回归分析的区别 在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。 相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。 相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。

对Excel 的回归结果进行分析 1. 变量间关系的度量 2. 估计的回归方程 3. 回归直线的拟合优度 4. 回归分析中的显著性检验 5. 估计和预测

第13章 时间序列分析和预测 13.1 时间序列及其分解 13.2 时间序列的描述性分析 13.3 时间序列的预测程序 第13章 时间序列分析和预测 13.1 时间序列及其分解 13.2 时间序列的描述性分析 13.3 时间序列的预测程序 13.4 平稳序列的预测 13.5 趋势型序列的预测 13.6 季节型序列的预测

时间序列的分类与成分 时间序列的分类:平稳序列和非平稳序列 时间序列的成分: 趋势性:持续向上或持续下降的状态或规律 季节性:时间序列在一年内重复出现的周期性波动 周期性:围绕长期趋势的一种波浪形或振荡式变动 随机性:除去趋势、周期性和季节性之后的偶然性波动

时间序列预测的程序 确定时间序列所包含的成分 选择合适的预测方法 对可能的预测方法进行评估,以确定最佳预测方案 利用最佳预测方案进行预测

计算误差 均方误差MSE

平稳序列的预测 简单平均法 移动平均法 指数平滑法