数据统计与分析 秦 猛 南京大学物理系 手机:13913939339 qinmeng@nju.edu.cn 第十讲 数据统计与分析 秦 猛 南京大学物理系 qinmeng@nju.edu.cn 办公室:唐仲英楼A508 83688960 手机:13913939339 1.

Slides:



Advertisements
Similar presentations
1 §2.2 离 散 型 随 机 变 量 §2.1 随 机 变 量 的 概 念 §2.3 超几何分布 · 二项分布 · 泊松分布 1. “0-1” 分布 ( 两点分布 ) 3. 二项分布 4. Poisson 分布 2. 超几何分布 n →∞ , N→∞ , (x = 0, 1, 2, , n) (x.
Advertisements

第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
概率统计与随机过程 宋 晖 – 2013年秋.
第一节 数理统计的基本概念.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
3.1.3 概率的基本性质.
第四章 概率、正态分布、常用统计分布.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
《高等数学》(理学) 常数项级数的概念 袁安锋
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
定积分的换元法 和分部积分法 换元公式 分部积分公式 小结 1/24.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
区间估计 Interval Estimation.
第四章 随机变量的数字特征 第一节 数学期望 第二节 方差 第三节 协方差及相关系数 第四节 矩、协方差矩阵.
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第十章 方差分析.
第六章 数理统计的基本知识 第一节 总体与样本
概 率 统 计 主讲教师 叶宏 山东大学数学院.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第三章 随机变量的数字特征 (一)基本内容 一、一维随机变量的数学期望 定义1:设X是一离散型随机变量,其分布列为:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
定义 设连续型随机变量 概率密度为 分布函数是 特别地, 其概率密度为 一、正态分布的相关内容:.
难点:连续变量函数分布与二维连续变量分布
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第五章 数理统计的基本知识 §5.1 总体与样本.
第八章 假设检验 8.3 两个正态总体参数的假设检验.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
数理统计部分 数理统计主要内容 第六章 样本及抽样分布 第七章 参数估计 第八章 假设检验
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
§4.5 最大公因式的矩阵求法( Ⅱ ).
第6章 数理统计基础 §6.1 数理统计的几个基本概念 §6.2 描述统计 §6.3 抽样分布.
Presentation transcript:

数据统计与分析 秦 猛 南京大学物理系 手机:13913939339 qinmeng@nju.edu.cn 第十讲 数据统计与分析 秦 猛 南京大学物理系 qinmeng@nju.edu.cn 办公室:唐仲英楼A508 83688960 手机:13913939339 1

《数理统计》

第六章 数理统计的基本概念 数 理 统 计 的 分 类 描述统计学 推断统计学 —— 对随机现象进行观测、试验, 以取得有代表性的观测值 第六章 数理统计的基本概念 数 理 统 计 的 分 类 描述统计学 推断统计学 —— 对随机现象进行观测、试验, 以取得有代表性的观测值 —— 对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性

参数估计 假设检验 推断 统计学 方差分析 回归分析

共同获得 2003年诺贝尔经济学奖 美国经济学家罗伯特 恩格尔 英国经济学克莱夫 格兰杰 (Robert F. Engle 1942 ~) 美国经济学家罗伯特 恩格尔 (Robert F. Engle 1942 ~) 英国经济学克莱夫 格兰杰 (Clive Granger 1934 ~) 共同获得 2003年诺贝尔经济学奖

20 世纪 80 年代两位获奖者 发明了新的统计方法来处理许多 经济时间数列中两个关键属性: 易 变 性 随时间变化的 非稳定性

§ 6.1 基本概念 总体和样本 总体 —— 研究对象全体元素组成的集合 § 6.1 基本概念 总体和样本 总体 —— 研究对象全体元素组成的集合 所研究的对象的某个(或某些)数量指标的全体,它是一个随机变量(或多维随机变量).记为X . X 的分布函数和数字特征称为总体的分布函数和数字特征.

个体 —— 组成总体的每一个元素 即总体的每个数量指标,可看作随机 变量 X 的某个取值.用 表示. 样本 —— 从总体中抽取的部分个体. 用 表示, n 为样本容量. 称 为总体 X 的一个容量为n的样本观测值,或称样本的一个实现. 样本空间 ——样本所有可能取值的集合.

N / n  10. 简单随机样本 若总体 X 的样本 满足: (1) 与X 有相同的分布 (2) 相互独立 则称 为简单随机样本. (2) 相互独立 则称 为简单随机样本. 一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.而代替的条件是 N / n  10. 样本容量 总体中个体总数

设总体 X 的分布函数为F (x),则样本 的联合分布函数为 若总体X 的 d.f.为 f( x),则样本 的联合 d.f.为

例如 设某批产品共有N 个,其中的次品数为M, 其次品率为 若 p 是未知的,则可用抽样方法来估计它. 从这批产品中任取一个产品,用随机变量 X来描述它是否是次品: X 服从参数为p 的0-1分布,可用如下表示 方法:

设有放回地抽取一个容量为 n 的样本 其样本值为 样本空间为 的联合分布为

若抽样是无放回的,则前次抽取的结果会影响后面抽取的结果.例如 所以, 当样本容量 n 与总体中个体数目N 相比很小时, 可将无放回抽样近似地看作放回抽样.

统计量 定义 设 是取自总体X 的一个样本, 为一实值连续函数,且不含有未知参数, 则称随机变量 为统计量. 若 是一个样本值, 称 的一个样本值 为统计量

例 是未知参数, 则 是一样本, 是统计量, 其中 但 不是统计量. 若  , 已知,则为统计量

常用的统计量 设 是来自总体 X 的容量 为 n 的样本,称统计量 为样本均值 为样本方差 为样本标准差

为样本的k 阶原点矩 为样本的k 阶中心矩 例如

注 样本方差 与样本二阶中心矩 的不同 关系式 1) 推导 故

2) 推导 设 则

228, 196, 235, 200, 199 例1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 例1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199 求这组样本值的均值、方差、二阶原点矩与二阶中心矩. 解 令

例2 在总体 中,随机抽取一个容量 为36的样本,求样本均值 落在50.8到53.8 之间的概率. 解 故

例3 设总体X 的概率密度函数为 为总体的样本,求 (1) 的数学期望与方差 (2) (3) 解(1)

(2) 近似 (3) 由中心极限定理

抽样分布 §6.2 确定统计量的分布 是数理统计的基本 问题之一 正态总体是最常见的总体, 本节介绍 的几个抽样分布均对正态总体而言.

统计中常用分布 (1) 正态分布 若 ~ 则 特别地, 若 i.i.d. ~ 则

标准正态分布的  分位数 定义 若 ,则称z 为标准正态 分布的上 分位数. 若 , 则称 为标准 正态分布的双侧  分位数.

标准正态分布的 分位数图形 常用 数字  z • -z/2=z1-/2 /2 /2 z/2 • -z/2 •

(2) 分布 ( n为自由度 ) 定义 设 相互独立, 且都服从标准正态分布N (0,1),则 n = 1 时,其密度函数为

n = 2 时,其密度函数为 为参数为1/2的指数分布.

一般 的密度函数为 自由度为 n 的 其中, 在x > 0时收敛,称为函数,具有性质

n=2 n = 3 n = 5 n = 10 n = 15

分布的性质 n = 10 例如  • 20.05(10)

证 1 设 相互独立, 则

(3) t 分布 (Student 分布) 定义 X ,Y相互独立, 设 则称 T 服从自由度为 n 的T 分布. 其密度函数为

n = 1 n=20 t 分布的图形(红色的是标准正态分布)

t 分布的性质 1°f n(t)是偶函数, 2°T 分布的上 分位数 t 与双测  分位数 t/2 均 有表可查.

n = 10  • • -t t

/2 /2 • • -t/2 t/2

(4) F 分布 定义 X, Y 相互独立, 设 令 则称 F 服从为第一自由度为n ,第二自由度为 m 的F 分布. 其密度函数为

m = 10, n = 4 m = 10, n = 10 m = 10, n = 15 m = 4, n =10 m = 10, n = 10 m = 15, n = 10

F 分布的性质 例如 求  事实上, F(n,m) • 故

例1 证明 证

例2 证明: 证 设 令

抽样分布的某些结论 (Ⅰ) 一个正态总体 设总体 ,样本为( ), 与 相互独立 (1) (2)

( II ) 两个正态总体 设 与 分别是来 自正态总体 与 的 相互独立的简单随机样本. 令

则 (3) 若 则

设 与 分别是来 自正态总体 与 的 相互独立的简单随机样本. 则

与 相互独立

(4)

例3设 ,为使样本均值大于70 的概率不小于90%,则样本容量至少取多少? 解 设样本容量为 n , 则 故 令 得 即 所以取

例4 从正态总体 中,抽取了 n = 20的样本 (1) 求 (2) 求 解 (1) 即

(2) 故

例5 设r.v. X 与Y 相互独立,X ~ N(0,16), Y ~ N(0,9) , X1, X2 ,…, X9 与Y1, Y2 ,…, Y16 分别是取自 X 与 Y 的简单随机样本, 求 统计量 所服从的分布. 解

从而

例7 设 是来自N ( , 2 )的 简单随机样本, 是样本均值, 则服从自由度为n - 1的t 分布的随机变量为

解 故应选 (B)

思考题: 1. 设 为从正态总体 X ~ N ( , 2) 中抽取的简单随机样本 其样本均值为 求统计量 的数学期望 E (Y ).

是来自正态 总体 的 容量为 n 的两个样本均值, 且两样本相互 独立, 试确定 n , 使两样本均值之差的绝 对值超过 的概率大约为 0.01.