Presentation is loading. Please wait.

Presentation is loading. Please wait.

管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 办公室: 中心教学楼1012房间

Similar presentations


Presentation on theme: "管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 办公室: 中心教学楼1012房间"— Presentation transcript:

1 管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 68912482 办公室: 中心教学楼1012房间
电话: 办公室: 中心教学楼1012房间

2 教材: 《 应用统计学 》 倪加勋等编著 中国人民大学出版社,1995

3 参考书: ①李维铮等,应用统计学,高等教育出版社,1994 ②张洪涛,管理统计学,中国铁道出版社,1994
③吴世农,管理统计学,江西人民出版社,1994 ④Jonathan D.Gryer,Bobert B.Miller, Statistics for Business,Date Analysis and Modeling -2nd edition Duxbury Press,1994 ⑤《数理统计与管理》,中国现场统计学会主办  《统计研究》,中国统计学会主办  《Annals of Statistics》  《 Journal of the Ammerican Statistical Association 》

4 主要内容(参见教材) 第一章 绪论 第二章 统计数据的描述 第三章 概率与概率分布 第四章 参数估计与假设检验 第六章 相关与回归

5 简要介绍的内容:(自学为主) 对学员的要求: (第五章)方差分析 §5.1,§5.2 (第七章)时间序列与指数 §7.4 (第九章)抽样调查
(第五章)方差分析 §5.1,§5.2 (第七章)时间序列与指数 §7.4 (第九章)抽样调查 对学员的要求: 1、掌握基本的统计方法 2、正确运用统计方法解决实际问题 3、运用统计软件求解统计问题 4、认真完成作业

6 平时作业(5分)+大作业(25分) +课堂考试(70分) 说明:不同书中有些概念的解释、定义可能会不同,以讲课中介绍的为准。 考核方式:

7 第一章 绪论(Preface) 近年来,由于某些主要产品及服务的激烈的国际竞争,企业界对统计分析有了新的评价。影响企业竞争力的主要因素是:质量(Quality)、成本(Cost)、计划安排(Scheduling),而这些因素的改进都需要用统计方法去设计和控制。另外,对市场(Marketing)做分析也需要用到统计方法。 本课程为MBA学生提供统计思维和统计方法的训练(Training)。统计思维使人们系统地澄清模糊的、不确定的过程,从而改进设计、降低成本。尽管统计学常被人们认为是很抽象、难学的学科,但实际上它是非常现实的学科,希望通过学习大家会体会到它的实用价值。

8 科学研究的步骤: ①观察(observations) ②假设(hypothesis) ③推论(deduction)
④验证(experimental verification)

9 例子:铁锹的学问(泰勒Taylor) 观察:注意铁锹的操作 假设:有好的方法使操作更有效 推论:工作有效性受负荷量影响
验证: 在不同条件下,用几种大小不同的铁锹,记录工作结果,并进行比较。 结论:负荷量是有效性的关键因素,标准的负荷量是21磅,对工厂和工人都受益。 统计学主要与①观察和④验证两步骤有关。

10 绪论的主要内容: 一、统计学在我国的发展 二、对统计学的认识 三、统计学的性质 四、统计学研究对象的特点 五、统计学应用 六、统计学分类
七、需注意的问题 八、计量水准的概念(自学)

11 一、统计学在我国的发展 第一阶段:1949年--1978年峨嵋会议
(解放前我国没有形成统计学学科体系) 我国在这阶段的统计学照搬苏联的体系,即"社会经济统计学",也称为"传统统计学"。主要研究:"统计指标体系"、"统计报表"、"收集数据"、"统计制度",很少对数据做统计推断。 认为统计学是"一门独立的社会科学",排斥数理统计学,认为概率、统计、抽样是投机赌博碰运气,冠以"资产阶级的统计学"。

12 一、统计学在我国的发展 第二阶段:1978年--现在 1.1978年峨嵋会议:两种观点争论激烈
观点1:“数理统计”才是真正的统计学,“社会经济统 计学” 是工作经验,不是科学。 观点2:“社会经济统计学”才是真正统计学,“数理统计”是数学。 2.1996年10月桂林会议,三大学会(中国统计学会,数理统计学会,中国现场统计学会)相聚,提出“大统计学”观点,认为统计学是将上面两者结合,应借鉴世界上普遍采用的体系。并指出要从发展眼光看统计学,它从对象、范围、方法论等方面早已同传统的统计学不同了。

13 二、对统计学的认识 传统的统计学侧重制度、指标、报表,实际中从事此类工作的人员易被别人替代(百分数)。统计学应是传统统计学与数理统计学的结合(见书中的体系) 做为管理人员要学会运用统计方法进行决策,改进工作,提高效率。

14 美国佛罗里达大学管理统计学课程主要内容: Methods for Describing Sets of Data Probability and Random Variables Sampling Distributions Inferences Based on a Single Sample Estimation Inferences Based on a Single Sample: Tests of Hypotheses Simple Linear Regression Multiple Regression Time Series: Index Numbers and Descriptive Analyses

15 三、统计学的性质 (什么是统计学?) 研究如何收集、整理、分析反映社会 经济管理问题的有关数据,并对研究对象 进行统计分析、推断的科学。 (以期认识事物的规律性)

16 四、统计学对象的特点 1。随机性:发生的结果不确定,不同个体 有差异 2。群体性:多个物体(单一物体不需统计) 3。数量性:以数量表示事件

17 五、统计学应用 1. 气象预报,证券分析,产品寿命估计,抽样检验,保险、库存量估计、市场分析。 2. 识别、度量风险,企业的风险管理 3
五、统计学应用 1.气象预报,证券分析,产品寿命估计,抽样检验,保险、库存量估计、市场分析。 2.识别、度量风险,企业的风险管理 3.精算学:以统计学为基础,与金融学、保险理论结合。确定保费、盈余分配、出险规律。 4.新闻调查 总之,没有统计分析的管理是不完善的管理。

18 统计学的应用 审计员检查一个大公司的帐目,可以通过统计方法抽取帐目样本,根据样本结果确定该公司是否有帐目不清的问题。
小企业的经理在确定原材料的进货量时。需要考虑可能的原材料需求水平和原材料存储费用。为此他要做相应的调查。 经济学家需要根据消费者的购买模式,评价改变销售税对社会的影响。为此他需要通过实地调查,了解主要地区不同收入阶层消费者的购买模式。

19 统计学的应用 营销经理在决定是否销售一种新产品时,对样本顾客进行试销,并依据评价效果确定可能的销售水平。
投资经理依据咨询师的观点并考虑当前政策和企业现状,估计各种投资收益率出现的概率。 生产经理根据检验产品样本的质量情况,决定是否对生产过程作出必要的调整。

20 六、统计学的分类 1、描述统计学 数据的搜集、整理、显示和分析 2、推断统计学 利用概率论和数据对事物的数量规律性进行估计、检验等推断。由部分推断总体,由现在推断未来。

21 七、需注意的问题 抽样误差(不可避免),系统误差(可避免) 1.正确选方法 例如:从AB,去时速度20km/h, 返回速度30km/h
2.统计方法要与定性分析相结合, 统计方法要与其他学科的知识相结合。 例如:电视增加,犯罪增加,是必然? 3.防止系统误差 抽样误差(不可避免),系统误差(可避免) 例:调查读书欲望,调查交通工具

22 一、统计数据的收集 二、统计数据整理 三、集中趋势的测度 四、离散程度的测度
第二章 统计数据的描述 一、统计数据的收集 二、统计数据整理 三、集中趋势的测度 四、离散程度的测度

23 一、统计数据的收集(13页) 1、利用已有资料 出版物政府公报、期刊、专业数据库 教材14页列出了统计出版物 2、调查收集(collection through survey) 全面调查 非全面调查 重点调查 抽样调查(随机) 调查方式:观察、访问、表格(常用) 3、调查方案(survey plan) 目的;②对象;③项目;④时间;⑤方式;⑥领导; 费用;(见教材16页) 4、误差 抽样误差(不可避免);②系统误差(可避免)

24 二、统计数据的整理 1.总体与样本 总体(Population) 样本(Sample) 涉及的全体元素 总体的部分元素 总体容量 样本容量 总体中元素个数N 样本中元素个数n 总体用X,Y……大写 例:身高X,体重Y等 样本用x,y….. 小写 例:x1x2……,y1y2……

25 二、统计数据的整理(18页) 2、数据分组 按照某种标志,将数据分为几个部分 目的是:快速找出数据的规律性 ①次数分配 fi 次数——落在第i组的数据个数 例如,20页的次数分配表 ②分组的有关问题 a、组数k≈ b、组距取整数(便于计算) c、等距,不等距(调整次数= d、上下限要明确,保证数据不重、不漏

26 二、统计数据的整理 3.累积次数 Fi=? 例 F1=3 F2=10 F3=23 F4=28 F5=30
4.频率,累积频率 fi/n, Fi/n便于不同容量资料的比较

27 二、统计数据的整理 ①直方图 横轴——分组标志 (histogram)纵轴——次数(或频率) (参见21页) 通过直方图可了解:
①直方图 横轴——分组标志 (histogram)纵轴——次数(或频率) (参见21页) 通过直方图可了解: a、研究对象的总体规律 b、各分组段的比例 c、数据的分布范围

28 二、统计数据的整理 ②条形图 (1)进出口增长(见图片80页) (2)人口金字塔(81页) ③圆饼图(见图片84页) ④象形图
世界人口变化(见图片85、86页) ⑤Lorenz曲线(见教材23页)

29 90 91 92 93 94 95 96 作业:168个商店投资情况分析 万元 0-1 1-2 2-3 3-5 5-10 10-20
万元 个数 不等距情况应保证调整次数后,直方图面积不变。 下图是否直方图 6000万元 长话收入 (某地区)

30 三、集中趋势的测度 1.均值 性质

31 三、集中趋势的测度 2.几何均值(Geometric mean) 适用于环比数据 例如:已知各年产值 a0,a1 ,a2,…,a5
X1=a1/a0,X2=a2/a1,X3=a3/a2,……,X5=a5/a4 称为环比数据。 求平均增长速度 有关系a5= a0Mg5

32 三、集中趋势的测度 3.调和均值(Harmonic mean) 此公式适用于两类变量的相对变化率数据 (例如:速度)
4.众数(Mode) 出现次数最多的数 5.中位数(Median) 排序数据的“中间值” 6.四分位数(Quartile) 位于 位的数(先排序) (考虑分组数据的以上指标)

33 四、离散程度的测度(32页) 1、极差:R=Xmax -Xmin 2、方差: (总体容量N) (样本容量n) 标准差 S=

34 四、离散程度的测度 对于分组数据 (xI为第i组的组中值) 方差另一种表达式 (可方便计算)

35 补充作业 调查一个村子中200个孩子的牙齿情况 A医生:在200人中抽20人,结果如下: 蛀牙数 孩子数 B医生:在200人中只记录了没有蛀牙的60名。估计村子里孩子总的蛀牙数: (1)用A的结果 (420) (2)用A,B的两种调查结果 (490)

36 第三章 概率及其分布(43页) (Probability and its distribution)
一、随机事件与概率 二、概率运算公式 三、随机变量及其分布 四、常用分布(61页) (此章内容为复习性质)

37 现实中的一些应用问题 需用到概率与统计的方法
例如: 预防性更换问题(寿命) 产品保换期的确定(寿命) 库存水平的确定(需求) (还有很多例子)

38 一、随机事件与概率 1、随机事件: 可能发生也可能不发生的结果。 基本事件是不可再分的随机事件。 (基本事件也称为样本点)
2、样本空间:样本点的全体 例:掷一个骰子: (等可能) 掷两个骰子: (不等可能)

39 一、随机事件与概率 3、事件的概率 古典概率: P(A)= m/n (样本点有限个,样本点等可能发生)
“统计”概率:m/n(n次试验中,A出现m次) P(A)=m/n 主观概率:由经验确定的 公理化概率:(满足下列条件) a、对事件A有 0≤P(A)≤1 b、P(S)=1 c、Ai互斥(i=1,2,…,n),则∑P(Ai)=P(∑Ai)

40 二、概率运算公式(1/2) P(Ai)——先验概率 1、加法 P(A+B)=P(A)+P(B)-P(AB)
2、乘法P(AB)=P(A)P(B|A) 3、独立性 P(AB)=P(A)P(B) 4、全概率公式P(B)=P(A)P(B|A)+P( )P(B| ) 5、贝叶斯公式P(Ai|B)= P(Ai)——先验概率 P(Ai|B)——后验概率(在掌握信息后对P(Ai)调整)

41 二、概率运算公式 例如:已知,在严格控制下次品率为0.05, 在不严格控制下次品率为0.20 又根据历史情况知道:
90%的工作时间为严格控制 P(C) 10%的工作时间为不严格控制 P(C’) 现从工作现场抽取一件产品为次品。 P(C|D)=0.69<0.9=P(C) (称P(C)为先验概率) 根据抽样为次品的情况,我们直觉上也倾向于严格控制的比例在减少。 D----次品 (称P(C|D)为后验概率)

42 三、随机变量及其分布 (random variable and its distribution)
r.v.—随机变量是用变量表示事件 1. r.v.特点 取值随机,取值的概率是确定的 r.v.分为连续、离散 习惯用X,Y….大写字母表示

43 三、随机变量及其分布 2、r.v.的分布 (1)离散r.v.分布 (discrete) X x1 x2…...Xn Pi P1 P2 Pn
也可写成P(X=xI)=表达式的形式 例如:= (掷骰子?)

44 三、随机变量及其分布 (2)连续r.v. X的分布(continuous) ①分布函数F(x)=P(X<x) 也可描述离散r.v.
O≤F(x)≤1, F(x)↗ F(∞)=?,F(-∞)=? ②分布密度函数f(x) f(x)≥0,F(x)= =1 F’(x)=f(x)

45 三、随机变量及其分布 ③密度f(x)几何意义 ④X连续r.v.,则P(X=a)=0。故此时F(x)=P(X<x)=P(X≤x)
⑤求概率的方法: P(X≤a)=F(a) P(X>a)=1-F(a) P(a<X<b)=F(b)-F(a) 例:下面哪些式子是不可能的? P(X=6)=0.8 P(X=10)=1.3 F(3.2)=1.6 f(1.5)=0.8 F1(3)=0.5 F1(4)=0.4 f2(3)=1.6 f1(4)=1.0

46 四、常用分布(61页) (1)离散r.v的分布 ①两点分布 X 0 1 形式: pI 1-p p 常记q=1-p
背景:产品检验(合格取1,不合格取0) 打靶 (中靶取1,不中靶取0) 期望:E(X)=p 方差:D(X)=pq

47 四、常用分布(61页) ②超几何分布 形式:P(X=k)= , K=0,1,…,min(n,M)
背景:产品检验。从N个产品中取n个检验,(其中有M个合格品)求n中有k个合格品的概率。 (即X——合格品个数) 不放回! 期望:E(X)=nM/N=np 方差:D(X)=npq

48 四、常用分布(62页) ③二项分布 形式:P(X=k)见书 背景:在n次独立重复试验中, “A发生K次”的概率。
(P为在一次试验中A发生的概率) 有放回的试验! 期望:E(X)=np 方差:D(X)=npq

49 四、常用分布(62页) ④泊松分布 形式:P(X=k)见书, k=0,1,…..n,…… 背景: 单位时间内,电话交换台接到的呼叫次数X
期望=方差:E(X)=D(X)=λ

50 四、常用分布 例:62页例3.11 例:某单位每天用水正常的概率3/4,求“近六天 内有四天用水正常”的概率。(每天用水独立)
例:20部机器独立工作。已知1小时内每部机器故障概率0.01。求: “1小时内20部机器中有2部故障”的概率。 若有2人看此20部机器,求“至少1人空闲”的概率?

51 四、常用分布(62页) 例:72页习题6 关于超几何、二项、Poisson分布的近似关系:
(1)当N大,n小(n/N<0.1)时,可用二项分布近似超几何分布(此时令P=M/N) (2)当n大,p小时,可用Poisson分布近似二项分布(取λ=np)。(n≥100,p≤0.01 np=1, 一般0.1<np<10即可)

52 四、常用分布(62页) (2) 连续r.v的分布 正态分布 形式:F(x)= f(x)= 背景:见63页 (1)实际应用,(2)理论近似
背景:见63页 (1)实际应用,(2)理论近似 期望:E(X)=u 方差:D(X)=σ2 记为N(u,σ2)

53 四、常用分布(63页) 正态分布密度函数的特点 对称的钟形 3σ=Δ P(|X-μ|<3σ)=0.9973
标准正态分布 ,记为N(0,1) 可查表知Φ(x)的值(430页) 标准化方法:F(x)=Φ( ) 例:Φ(1)=? Φ(1.1)=? Φ(1.11)=? P(X≤μ+σ)=F(μ+σ)= Φ(1)= P(μ-3σ<X<μ+3σ)=F(μ+3σ)-F(μ-3σ)=Φ(3)-Φ(-3)

54 四、常用分布 例题:见65页例3.12 例题: 预防性更换 确定更换时间t0使产品在t0时可靠度为0.90(t0称为可靠寿命)
解:设X—寿命服从正态分布N(20,32) 例题:确定产品的保用年限 见73页习题9

55 四、常用分布(66页) ②指数分布 形式:F(x)=1-e-λx,x≥0 f(x)=1-e-λx,x≥0
背景:电子产品的寿命、服务时间、顾客到 达间隔时间一般服从指数分布。 期望:E(X) = 1/λ 方差:D(X) = 1/λ2

56 四、常用分布(66页) ③均匀分布 形式:F(x)= 0 x<a a≤x≤b 1 x≥b
f(x)= 1/b-a a<x<b 其它 背景:特定情况下 期望:E(X)=(a+b)/2 方差:D(X)=(b-a)2/12

57 概率的应用 例:某汽车加油站每周补充一次汽油。现在要确定此加油站储油库的最少容油体积,使得在一周内加油站的油售完的概率不大于0.01。要解决此问题,应考虑哪些因素,应如何收集数据,应采用什么统计方法,建立什么概率模型?

58 对问题的讨论(确定储油量的例子) 1、要明确随机变量X。显然X为“加油站每周的售油量(单位:KL)”,此为连续型随机变量。 2、要确定X服从的分布函数F(x)或分布密度f(x)。 若F(x)或f(x)未知,则应收集加油站每周的售油量的历史数据x1 ,x2, ……xn,绘制直方图,以此粗略判断分布类型。然后,用统计方法进行拟合优度检验。最后确定分布形式F(x)或f(x)。

59 (接上页) 3、若F(x)或f(x)已知,设 f(x)=C(1-x)3 0<x<1 (C为待定常数) 其它 这里首先需要确定C为多少?根据分布密度性质,C应满足 ,由此可推出C=4。然后,建立概率模 型为:P(X>t0)= 即(1- t0)4≤0.001 , t0≥ =0.6838(KL) 因此,储油库容油体积至少为684L才能保证在一周内售完油的概率不大于0.001。

60 概率的应用 例:某药品反应率为0.0001。现有2万人使用此药。求这2万人中发生过敏反应的人数不超过3人的概率。
解:X——2万人中发生过敏反应的人数 P(X≤3)=P(X=0)+P(X=1)+P(X=2)+P(X=3) 用什么分布?

61 例:产品合格标准。若使产品(布)的合格率达98%,则单位面积的疵点数最多定为多少为合格标准x0 ?
P(X≤x0)=0.98= 1+3+9/2 +27/6 +81/24+81*5/24*5 +1.0125≥19.68(i=7)

62 概率的应用 例:在前面“预防性更换”的题目中,若寿命X服从指数分布,情况会如何? 例:门的高度确定?
例:60岁健康人,5年内死亡的概率为P,保险公司办理5年保险交a元。死亡则赔b元。a=?b=?使公司获利。 X a a-b 解: P 1-P P a-bP≥0 ∴a<b<a/P

63 例:无人售票的可行性? 例:一项工程项目能否在26天(规定时间内)完成? (已知施工完成时间X∽?) 上面例题中涉及到的参数,均需由实际调查、试验数据确定。需依靠统计方法解决。一般密度函数f(x)与直方图相对应。

64 第四章 参数估计与假设检验 一、抽样的基本概念 二、抽样分布 三、参数估计

65 一、抽样的基本概念(Sampling) 1、样本的两重性(总体X) 抽样前样本看成随机变量 X1 ,X2 ……Xn
2、简单随机样本 ①X1 ,……Xn与总体X有同分布 ②X1 ,……Xn相互独立 (independent identity distributions:iid) 3、样本统计量 样本的函数( ,S2等),也有两重性。 统计量服从的分布——抽样分布

66 二、抽样分布 抽样分布一般较复杂,但对于正态总体较简单。 χ20.05(10)=18.307
1. X1 …..Xn iid 于N(μ,σ2),则X∽N(μ, ) (在大样本时,(n≥30),可不做总体的正态假设) 2. χ2分布(见76页)(不对称分布) X1……. Xn iid N(0,1),则χ2 =∑Xi2∽ χ2(n) 其中n—自由度 df (degree of freedom) 一般求χ2 :P(χ2 (n)> χ2 )= , (查表433页) 例: =0.05, n=10 χ20.05(10)=18.307

67 二、抽样分布 Sampling distribution
(是对称分布 symmetrical distributiom n≥30时,近似正态分布) 有自由度要求 经常求:t/2 双侧百分位数:P(T> t/2)=  t 单侧百分位数:P(T>t)= (查表434页) 例:=0.1 t/2(21)=1.721, t (21)=1.323

68 三、参数估计 (用样本对分布中的参数加以推断) 1、点估计 代替法:用频率代替概率 用样本特征代替总体特征值 (总体特征包括:均值、方差等)
注意:①用此法时,需知道总体特征与参数的关系 ②样本均值 样本方差

69 三、参数估计 例如:X∽N(μ,σ2),则 ( 表示参数μ的点估计值,其他参数同样解释)
( 表示参数μ的点估计值,其他参数同样解释) 例如:X∽指数分布F(x)=1-e-λx,均值为1/λ 则 ∴ 例如:X∽[a,b]上均匀分布,则 = , 由这两个式子求出

70 三、参数估计 2、估计量的标准 无偏性 E( )= 例如: 、中位数都是均值参数(μ)的无偏估计。S2是方差参数(σ2)的无偏估计。
有效性:参数θ的两个无偏估计θ1,θ2,若 E(θ1-θ)2≤E(θ2-θ)2,则称θ1比θ2有效。 例如, 比中位数有效。 为均值参数的“最小方差无偏估计”。

71 三、参数估计 3.区间估计 思想:确定一个区间,保证以很大概率使参数落入该区间中。
(此区间一般应包含参数的点估计) 例:设x1 ,x2…… ,xn是来自于总体N(μ,32)的 样本,试确定区间,使其有95%把握包含参数μ。

72 三、参数估计 解:已知 服从N(0,1)。 由于 可查正态分布表得出 因此,有 其中 称为置信度, 包含μ的区间,称为置信区间。

73 均值  的区间估计 设 X1 …..Xn iid 于N(μ,σ2), 为μ的点估计,求置信度为 1- 的 μ 的置信区间。 σ已知时:
由于 z= 服从N(0,1), 得到置信区间 说明:对于非正态总体,当 n > 50 时,仍可用 z 统计量进行区间估计,并用 S 代替σ(见89页例4.5)。

74 总体均值  的区间估计 σ未知时:σ未知时(小样本) 已知 t = 服从 t(n-1) 分布, 得置信区间 例题见90页(例4.6)
得置信区间 例题见90页(例4.6) 一般对称区间时,置信区间最短。

75 推荐网站: 北京大学中国经济研究中心——双学位讲义中的《商务与经济统计》。 网址:

76 样本容量的确定 [在正态总体下(非正态不易处理)均值区间估计时的样本容量n的确定方法] 若规定区间宽度为2△(△为 偏差,允许误差)则有 问题:当区间减少一半时,n增加多少?

77 在点估计中用无偏性、有效性(方差大小)衡量估计量的优劣。
在区间估计中用置信度、样本容量及区间宽度衡量优劣。 有关系:  n不变,1-α增大,则 增大,即宽度增大,精度下降。所以追求置信度高,则影响精度。  1-α不变, n增大,则宽度减小,精度上升。 但是,如果n太大,会造成浪费,失去抽样意义,因此,精度的选取要适当。

78 例:5000人中抽100人,计算出 平均月 收入800 元。 ①求这5000人中平均月收入范围 (取 =0.99,σ=10) ② △最大偏差是多少? ③ 不变,使△减少 ,n为多少? ④△不变,使 =0.95,n为多少? 1-α 1-α 1-α

79 ① =2.576, △= = , ② △= ③n=225 ④n=

80 背景:随机抽取的n个产品中有k件次品,则次品率的点估计为
现有结论: 近似地有: 得p的置信区间为: 例题见 91页——例4.7

81 两总体均值差的区间估计(见92页,此部分自学)
正态总体方差 的区间估计 设 iid N(μ,σ2), S2为σ2的点估计,求置信度1-的置信区间。 已知 查表求

82 得 的置信区间: 例题 97页——例4.10 ( 没有在教材后的表中,可在其 他书中找)

83 两个正态总体方差比的区间估计( ) 从 两个总体中独立各取样本,样本方差分别为 , ,现 对 做区间估计。

84 已知 , , , 得到:

85 此区间估计常用来比较方差大小,当上限1,下限1时,不能做比较,需用其他方法。
例题:见97页——例4.11 参数区间估计小结表见99页——100页。 查 ,

86 四、假设检验(Testing Hypothesis)
统计推断的又一类问题,对问题得出“是”与“否”的结论。 背景: ①改进加工工艺后,产品的平均尺寸是 否显著变化?(原尺寸 改进 工艺后,取10件测量, ) ②改进工艺后,生产是否稳定?( 是 否显著变化? ③合格率是否符合规定? ④产品寿命是否符合正态分布?

87 对以上问题,可分别假设: ① :没有显著变化, ② :稳定, ③ :符合规定 ④ :服从正态 然后根据样本,判定 是否正确,若正确,接受 ,否则拒绝 。这就是假设检验的内容。 一般把要检验的假设称为原假设(零假设 ),与原假设相反的假设称为备择假设 。

88 理论依据:“小概率原理”——小概率事件在一次试验中几乎不发生。 1.假设检验的思想: 举例: 已知在总体 时,若 成 立,即 则应有
已知在总体 时,若 成 立,即 则应有 (即以很大概率出现,相反的不等式对应的事件以小概率出现)

89 现经抽样 ,计算 若 ,则没有矛盾。 若 ,说明“小概率”事 件在一次试验中出现了。这是与小概率原理矛盾的,说明 错了。 2.假设检验的步骤: a.建立原假设(及备择假设) b.确定显著性水平 表明:当零假设正确时,拒绝 的概率 是 [弃真错误]

90 c.选择统计量 (例如: , d.计算统计量的值,与临界值做比较 若超出临界值,则拒绝 若小于临界值,则接受 若等于临界值,则加大样本容量。

91 3.检验的内容( 页) ①总体均值的假设检验 , (已知数) 已知时,用z统计量 未知时,用t统计量(用s代替 ) (例题见104页,例4.13) 大样本时( ),不论总体为何种分布,均可用z统计量近似。

92 ②两正态总体均值是否相等的检验 , , 已知时,用z统计量 未知时,用t统计量(且要求 可用 代替 )。 大样本时( ),不论总体为何种分 布,均可用z统计量分析。 (例题,105页——例4.14)

93 ③总体方差的假设检验 统计量, 查表,得 若 ,则接受原假设; 若反之,则拒绝原假设。 例题,见106页,例4.15

94 其他检验内容略。 汇总表(Hypothesis Testing),见 页。 作业: 页 4、5、6、8、10(1)(2)、12、 13、14

95 1993,1994年上证所商业类上市公司净资产收益率之间是否有显著性差异?
4.假设检验的例子 1993,1994年上证所商业类上市公司净资产收益率之间是否有显著性差异? 解:设收益率 , 第一食品 新世界 东北华联 济南百货 1993年(1) 7.9 5.6 7.75 11.00 1994年(2) 12.35 13.96 1.23 6.16

96 方法1: 处理数据: -4.45,-8.36,6.52,4.84(n=4) (没差异), 统计量 计算 经比较 ,故没显著差异。

97 方法2:直接用105页的公式。但前提是 两总体方差相等。此题中对是否 两总体方差相等是不清楚的,故 不宜使用此公式。若可证明两总 体方差相等,则可用此方法。 关于两总体方差相等的检验见( 页)。 说明:此例子用方法1处理的前提是两个样本容量相同。

98 两校新生学习(高等数学)成绩 是否有差异?(成绩服从正态分布)
解释计算结果: ①93-94年,上证所上市类公司净资产收 益率之间没有显著差异。 ②将没差异判断为有差异的可能性是5%。 此例摘自《数理统计与管理》杂志97年第4期。 补充作业: 两校新生学习(高等数学)成绩 是否有差异?(成绩服从正态分布) 甲校 11名 乙校 11名

99 5.两类错误 不变多少,在拒绝 时,均会有失误(随机因素造成的),称之为弃真错误,也称为第一类错误、供货方风险。还有一类取伪错误 ,也称为第二类错误、使用方风险。一般控制 情况较多,本课中不讨论 的计算问题。

100 两类错误 的示意图 ( 与 不可能同时减小)

101 6.点估计、区间估计、假设检验的用途 ① 主要用于确定分布函数中 的参数。 ② 主要用于估计指标的范围 (例如城市人口、平均消费量等), 还可用于确定样本容量。 ③ 主要用于同以往情况的比 较,用于不同总体的比较,两者差异 的判断。

102 例如,公安系统破案时,对现场的脚印、步幅等同嫌疑人做比较。
7.单侧假设检验 (略)

103 第六章 回归分析 一、变量之间的关系 a.函数关系 X→Y ,例如y=lnx (一一对应) b.相关关系(统计关系) x与y有依存,但y不是由x唯一确定的。 (有对应,但不唯一确定) 例:价格——需求量 气温——冷饮、空调需求量

104 回归分析:根据观测数据,对具有统计关系的变量建立回归模型,并进行统计推断。
解决以下问题: ①确定变量间是否有统计关系(相关关系),若有,找出表达式; ②根据一个或一组变量的值,预测另一个变量的值。

105 回归模型的种类 单变量 多变量 线性 非线性

106 二、一元线性回归(Simple Linear
Regression) 例: X—价格,Y—产品需求量, 测得数据:

107 1.散点图(Scatter plot) 由图设想用 近似表示X、Y的相关关系。 y与 有差别。 2.回归方程

108


Download ppt "管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 办公室: 中心教学楼1012房间"

Similar presentations


Ads by Google