Presentation is loading. Please wait.

Presentation is loading. Please wait.

北京师范大学珠海分校 国际特许经营学院与不动产学院 学年第二学期 欧阳顺湘

Similar presentations


Presentation on theme: "北京师范大学珠海分校 国际特许经营学院与不动产学院 学年第二学期 欧阳顺湘"— Presentation transcript:

1 北京师范大学珠海分校 国际特许经营学院与不动产学院 2004-2005学年第二学期 欧阳顺湘 2005.6.10
大学文科数学 之 线性代数与概率统计 北京师范大学珠海分校 国际特许经营学院与不动产学院 学年第二学期 欧阳顺湘

2 统计概述 What is Statistics? Mathematical Statistics

3 统计学 还是 数理统计学

4 统计的含义 统计工作: 收集数据的活动 统计数据: 统计活动的结果 统计学: 分析统计数据的方法和科学

5 从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作
从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作 . 但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断.

6 What is Statistics? 最早的含义: 国情学 stat state 《大不列颠百科全书》收集、分析数据的科学和艺术
Statistics is a collection of procedures and principles for gaining and processing information in order to make decisions when faced with uncertainty.

7 (数理)统计学是一门应用性很强的学科. 它是研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.

8 数理统计的特点是应用面广,分支较多. 社会的发展不断向统计提出新的问题.
数理统计的特点是应用面广,分支较多. 社会的发展不断向统计提出新的问题. 计算机的诞生与发展,为数据处理提供了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.

9 统计学习 把时间用在基本概念、方法原理的正确理解上. 学会用计算机处理数据 Excel 著名的统计软件包:
SAS,SPSS,STAT,Minitab Statistica等,

10 学习内容 重要概念 总体 样本 统计量 典型的统计方法, 描述统计 推断统计

11 描述统计(descriptive statistics)
使用 Excel 展示上学期学生成绩的处理

12 推断统计(inference statistics)

13 数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析.
由于大量随机现象必然呈现出它的规律性,因而从理论上讲,只要对随机现象进行足够多次观察,被研究的随机现象的规律性一定能清楚地呈现出来. 只允许我们对随机现象进行次数不多的观察试验,也就是说, 我们获得的只是局部观察资料. 但客观上

14 数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论.

15 在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.
由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息. 因而由此获得的结论必然包含不肯定性.

16 例 用Excel 抽样 对学生成绩进行估计

17 统计学基本概念 总体 样本 样本值 统计量

18 二、统计量和抽样分布 1. 统计量 由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来. 这种不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.

19 研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.
总体 随机抽样 样本 作出推断 描述 统计量 研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.

20 它反映了总体均值 的信息 几个常见统计量 样本均值 它反映了总体方差 的信息 样本方差 有差别 (注意不同的定义)

21 它反映了总体k 阶矩 的信息 样本k阶原点矩 样本k阶中心矩 它反映了总体k 阶 中心矩的信息 k=1,2,…

22 定义 1 设  为总体, 则称 则称 矩估计原则:用样本矩估计总体矩

23

24 定理 1 (样本均值的分布) 设X1,X2,…,Xn是取自  的样本,且有 则有

25 2. 经验分布函数

26 3. 抽样分布 统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布” .

27 抽样分布就是通常的随机变量函数的分布. 只是强调这一分布是由一个统计量所产生的
抽样分布就是通常的随机变量函数的分布. 只是强调这一分布是由一个统计量所产生的. 研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质. 精确抽样分布 (小样本问题中使用) 抽样分布 渐近分布 (大样本问题中使用)

28 三. 统计三大分布 分布是由正态分布派生出来的一种分布. 定义: 设 相互独立, 都服从正态 分布N(0,1), 则称随机变量:
1、 分布是由正态分布派生出来的一种分布. 定义: 设 相互独立, 都服从正态 分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布. 记为

29 分布的密度函数为 来定义. 其中伽玛函数 通过积分 请看演示 分布

30 由 分布的定义,不难得到: 1.   设 相互独立, 都服从正态分布 2. 设 且X1,X2相互 独立,则 这个性质叫 分布的可加性.

31 则可以求得, E(X)=n, D(X)=2n 应用中心极限定理可得,若 ,则当n充分大时, 的分布近似正态分布N(0,1).

32 所服从的分布为自由度为 n的 t 分布. 记为T~t(n). T的密度函数为: 2、t 分布
定义: 设X~N(0,1) , Y~ , 且X与Y相互独立,则称变量 所服从的分布为自由度为 n的 t 分布. 记为T~t(n). T的密度函数为:

33 具有自由度为n的t分布的随机变量T的数学期望和方差为:
E(T)=0; D(T)=n / (n-2) , 对n >2 t分布的密度函数关于x=0对称,且 当n充分大时,其图形类似于标准正态分布密度函数的图形.

34 不难看到,当n充分大时,t 分布近似N (0,1)分布. 但对于较小的n,t分布与N (0,1)分布相差很大.
请看演示 t 分布 不难看到,当n充分大时,t 分布近似N (0,1)分布. 但对于较小的n,t分布与N (0,1)分布相差很大.

35 服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 F~F(n1,n2) .
定义: 设 X与Y相互独立,则称统计量 服从自由度为n1及 n2 的F分布,n1称为第一自由度,n2称为第二自由度,记作 F~F(n1,n2) . ~F(n2,n1) 由定义可见,

36 若X~F(n1,n2), X的概率密度为 X的数学期望为: 若n2>2 即它的数学期望并不依赖于第一自由度n1. 请看演示 F分布

37 统计三大分布的定义、基本性质在后面的学习中经常用到,要牢记!!

38 四、几个重要的抽样分布定理

39 定理 1 (样本均值的分布) 设X1,X2,…,Xn是取自正态总体 的样本,则有

40 n取不同值时样本均值 的分布

41 定理 2 (样本方差的分布) 设X1,X2,…,Xn是取自正态总体 的样本, 分别为样本均值和样本方差, 则有

42 n取不同值时 的分布

43 定理 3 设X1,X2,…,Xn是取自正态总体 的样本, 分别为样本均值和样本方差, 则有

44 定理 4 (两总体样本均值差的分布) 分别是这两个样本的 且X与Y独立, X1,X2,…, 是取自X的样本, 取自Y的样本,
分别是这两个样本的样本方差, 均值, 则有 Y1,Y2,…, 样本

45 定理 5 (两总体样本方差比的分布) 分别是这两个样本的 且X与Y独立, X1, X2,…, 是取自X的样本, 取自Y的样本,
分别是这两个样本的样本方差, 均值, 则有 Y1,Y2,…, 样本

46 上述5个抽样分布定理很重要, 要牢固掌握.

47 可见,在数理统计中必然要用到概率论的理论和方法. 因为随机抽样的结果带有随机性,不能不把它当作随机现象来处理 . 
由此也可以说, 概率论是数理统计的基础,而数理统计是概率论的重要应用. 但它们是并列的两个学科,并无从属关系 .

48 在结束本节之前,我们需要强调说明一点: 统计方法具有“部分推断整体”的特征 .   因为我们是从一小部分样本观察值去推断该全体对象(总体)情况,即由部分推断全体. 这里使用的推理方法是“归纳推理”.

49 这种归纳推理不同于数学中的“演绎推理”,
它在作出结论时,是根据所观察到的大量个别情况,“归纳”起来所得,而不是从一些假设、命题、已知的事实等出发,按一定的逻辑推理去得出来的.

50 例如,在几何学中要证明“等腰三角形底角相等”只须从“等腰”这个前提出发,运用几何公理,一步一步推出这个结论.
而一个习惯于统计思想的人,就可能想出这样的方法:做很多大小形状不一的等腰三角形,实地测量其底角,看差距如何,根据所得资料看看可否作出“底角相等”的结论. 这样做就是归纳式的方法.

51 现在要问:从局部观察要对总体下结论有没有片面性呢?结论是否可靠?
显然这里不仅依赖于进行局部观察的“样本”是否具有总体的代表性,也依赖于对从这些样本得到数据的合理加工、分析并得出论断.

52 我们说,如果这一切都建立在可靠的科学基础上,则对总体下结论是可能的也是可靠的
我们说,如果这一切都建立在可靠的科学基础上,则对总体下结论是可能的也是可靠的. 因为这里存在着样品(随机抽取的一个个体)个性 (特殊性) 和总体共性(普遍性)之间的一种内在的、对立统一的辩证关系 . “每一事物内部不但包括了矛盾的特殊性,而且包含了矛盾的普遍性,普遍性即存在于特殊性之中. ” 《矛盾论》 毛泽东

53 我们对每个经过合理手续选取的一个样品也应看到它所具有的两重性:
一方面它具有特殊性,因为它毕竟是个别观察值,不能反映总体的全面性质,有片面性. 因而统计上往往不采用由一次抽取的样品来下结论.

54 另一方面也要看到“普遍性即存在于特殊性之中”,即每个样品的情况又必然反映总体的一些普遍性.
当样品有一定数量时总体的普遍性是可以得到比较真实的反映的. 在这个基础上再加上科学的推断方法,对总体下的结论同样也是可靠的.

55 但此时还应记住毕竟是由“局部”推断“整体”,因而仍可能犯错误,结论往往又是在某个“可靠性水平”之下得出的.
这种矛盾的特殊性与普遍性的辩证统一在统计学中贯穿始终,是我们应该记住的基本思想.

56 练习 Page


Download ppt "北京师范大学珠海分校 国际特许经营学院与不动产学院 学年第二学期 欧阳顺湘"

Similar presentations


Ads by Google