管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 办公室: 中心教学楼1012房间

Slides:



Advertisements
Similar presentations
排列 组合 概率 会考复习. 排列、组合是不同的两个事件,区别的 标志是有无顺序,而区分有无顺序的办法是: 把问题的一个选择结果解出来,然后交换这 个结果中任意两个元素的位置,看是否会产 生新的变化,若有新变化,即说明有顺序, 是排列问题;若无新变化,即说明无顺序, 为组合问题 知识要点.
Advertisements

高考数学专题之概率 高考数学冲刺 主讲人 : 北京大学光华管理学院 何洋. 北京师范大学京师大厦 9810 室 电话 : 传真 : 写在前面的话 概率是高中数学新教材中新增的内容, 在 实际生活中应用非常广泛, 并且由于概率 论是统计学的基础,
必修部分 必修部分 延伸部分 單元 2 Module 2 (M2) 代數與微積分 延伸部分 單元 2 Module 2 (M2) 代數與微積分 延伸部分 單元 1 Module 1 (M1) 微積分與統計 延伸部分 單元 1 Module 1 (M1) 微積分與統計 新高中數學科 同學可加選以下一個單元修讀.
1 第六章 機率分配. 2 隨機變數 機率分配函數 常用的機率分配 3 隨機變數 (random variable) 將隨機實驗中每一個樣本點對應至實數值 之 “ 函數 ” 隨機變數 f.
第十三章 医学统计学方法的基本概念和基本步骤
概率.
第四章:长期股权投资 长期股权投资效果 1、控制:50%以上 有权决定对方财务和经营.
概率论与数理统计 2.3 连续型随机变量及其分布.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
郑州轻工业学院数学与信息科学系 第七章:参 数 估 计 概率统计教研组.
Statistical Probability for Production Simulation
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第一节 预备知识 一、乘法原理 排列及组合 1、乘法原理 乘法原理:若完成一件事情要经过两个步骤,其中第一步中有 种不同的方法,第
3.1 随机事件及其概率 3.2 随机变量及其概率分布 3.3 大数定律与中心极限定理
第一章 緒論.
8+2-3=? 統計 吳函儒、李雅芳 吳秉蓉、王農景 - =
機率的意義 機率運算法則 機率分佈 二項分佈 卜瓦松分佈
常用的機率分配 6.1 二項分配 6.2 超幾何分配 6.3 幾何分配 6.4 Poisson分配 6.5 負二項分配 6.6 均勻分配
第 1 章 資料與統計.
常用逻辑语.
命题的四种形式 高二数学.
1.1.2 四 种 命 题.
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
第一章.
本幻灯片可在如下网站下载: 概率论与数理统计第14讲 本幻灯片可在如下网站下载:
第三章 水文统计的基本原理与方法.
第五章 定积分及其应用.
概率论与数理统计 2.1 随机变量与分布函数.
統計學 授課教師:林志偉 Tel:5021.
第十八章 技术.
Analysis of Variance 變異數分析
Population proportion and sample proportion
§24 常用的连续型分布 一、均匀分布 二、指数分布 三、正态分布.
概率论与数理统计模拟题(3) 一.填空题 3且 1.对于任意二事件A 和 B,有P(A-B)=( )。 2.设 已知
Properties of Continuous probability distributions
Sampling Theory and Some Important Sampling Distributions
研究方法 Research Methodology
第六章 機率分配.
在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.
二元隨機變數(Bivariate Random Variables)
Workshop on Statistical Analysis
Chap 9 Testing Hypotheses and Assessing Goodness of Fit
第四章 抽樣與抽樣分配 4.1 抽樣與抽樣方法 抽樣分配概論 常見的抽樣分配 中央極限定理55
导数的应用 ——函数的单调性与极值.
生物統計 1 課程簡介 (Introduction)
第一章.
第二章 随机变量及其分布 热点问题剖析.
实验数据处理方法 王永刚.
Introduction to Basic Statistics
第二章 随机变量及其分布 §2.1 随机变量及其分布 §2.2 随机变量的数学期望 §2.3 随机变量的方差与标准差 §2.4 常用离散分布
概率论 ( Probability) 2016年 2019年4月15日5时31分.
抽樣分配 Sampling Distributions
Introduction to Basic Statistics
《概率论》总复习.
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
研究所生物統計課程整合說明 課程規劃及修課建議 楊奕馨 高雄醫學大學 藥學系 研究所生統課程授課教師
人口预测 Population Projection
Review of Statistics.
医学统计学 (Medical Statistics)
解 : 设事件 Ai( i=1,2,3,4 ) 为“第 i 个继电器接点闭合”, L 至 R 为通路这一事件可表示为:
Biostatistics 生物統計學 醫學影像處理實驗室.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第七章 计量资料的统计分析.
課程五 機率.
抽樣分配 許明宗.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
概率论与数理统计.
第7章 常用機率分配.
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

管理统计学 主讲人: 北京理工大学 管理与经济学院 李金林 电话: 68912482 办公室: 中心教学楼1012房间 电话: 68912482 办公室: 中心教学楼1012房间 E-mail: jinlinli@sina.com.cn lijinlin@mail.bit.edu.cn

教材: 《 应用统计学 》 倪加勋等编著 中国人民大学出版社,1995

参考书: ①李维铮等,应用统计学,高等教育出版社,1994 ②张洪涛,管理统计学,中国铁道出版社,1994 ③吴世农,管理统计学,江西人民出版社,1994 ④Jonathan D.Gryer,Bobert B.Miller, Statistics for Business,Date Analysis and Modeling -2nd edition Duxbury Press,1994 ⑤《数理统计与管理》,中国现场统计学会主办  《统计研究》,中国统计学会主办  《Annals of Statistics》  《 Journal of the Ammerican Statistical Association 》

主要内容(参见教材) 第一章 绪论 第二章 统计数据的描述 第三章 概率与概率分布 第四章 参数估计与假设检验 第六章 相关与回归

简要介绍的内容:(自学为主) 对学员的要求: (第五章)方差分析 §5.1,§5.2 (第七章)时间序列与指数 §7.4 (第九章)抽样调查 (第五章)方差分析 §5.1,§5.2 (第七章)时间序列与指数 §7.4 (第九章)抽样调查 对学员的要求: 1、掌握基本的统计方法 2、正确运用统计方法解决实际问题 3、运用统计软件求解统计问题 4、认真完成作业

平时作业(5分)+大作业(25分) +课堂考试(70分) 说明:不同书中有些概念的解释、定义可能会不同,以讲课中介绍的为准。 考核方式:

第一章 绪论(Preface) 近年来,由于某些主要产品及服务的激烈的国际竞争,企业界对统计分析有了新的评价。影响企业竞争力的主要因素是:质量(Quality)、成本(Cost)、计划安排(Scheduling),而这些因素的改进都需要用统计方法去设计和控制。另外,对市场(Marketing)做分析也需要用到统计方法。 本课程为MBA学生提供统计思维和统计方法的训练(Training)。统计思维使人们系统地澄清模糊的、不确定的过程,从而改进设计、降低成本。尽管统计学常被人们认为是很抽象、难学的学科,但实际上它是非常现实的学科,希望通过学习大家会体会到它的实用价值。

科学研究的步骤: ①观察(observations) ②假设(hypothesis) ③推论(deduction) ④验证(experimental verification)

例子:铁锹的学问(泰勒Taylor) 观察:注意铁锹的操作 假设:有好的方法使操作更有效 推论:工作有效性受负荷量影响 验证: 在不同条件下,用几种大小不同的铁锹,记录工作结果,并进行比较。 结论:负荷量是有效性的关键因素,标准的负荷量是21磅,对工厂和工人都受益。 统计学主要与①观察和④验证两步骤有关。

绪论的主要内容: 一、统计学在我国的发展 二、对统计学的认识 三、统计学的性质 四、统计学研究对象的特点 五、统计学应用 六、统计学分类 七、需注意的问题 八、计量水准的概念(自学)

一、统计学在我国的发展 第一阶段:1949年--1978年峨嵋会议 (解放前我国没有形成统计学学科体系) 我国在这阶段的统计学照搬苏联的体系,即"社会经济统计学",也称为"传统统计学"。主要研究:"统计指标体系"、"统计报表"、"收集数据"、"统计制度",很少对数据做统计推断。 认为统计学是"一门独立的社会科学",排斥数理统计学,认为概率、统计、抽样是投机赌博碰运气,冠以"资产阶级的统计学"。

一、统计学在我国的发展 第二阶段:1978年--现在 1.1978年峨嵋会议:两种观点争论激烈 观点1:“数理统计”才是真正的统计学,“社会经济统 计学” 是工作经验,不是科学。 观点2:“社会经济统计学”才是真正统计学,“数理统计”是数学。 2.1996年10月桂林会议,三大学会(中国统计学会,数理统计学会,中国现场统计学会)相聚,提出“大统计学”观点,认为统计学是将上面两者结合,应借鉴世界上普遍采用的体系。并指出要从发展眼光看统计学,它从对象、范围、方法论等方面早已同传统的统计学不同了。

二、对统计学的认识 传统的统计学侧重制度、指标、报表,实际中从事此类工作的人员易被别人替代(百分数)。统计学应是传统统计学与数理统计学的结合(见书中的体系) 做为管理人员要学会运用统计方法进行决策,改进工作,提高效率。

美国佛罗里达大学管理统计学课程主要内容: Methods for Describing Sets of Data Probability and Random Variables Sampling Distributions Inferences Based on a Single Sample Estimation Inferences Based on a Single Sample: Tests of Hypotheses Simple Linear Regression Multiple Regression Time Series: Index Numbers and Descriptive Analyses

三、统计学的性质 (什么是统计学?) 研究如何收集、整理、分析反映社会 经济管理问题的有关数据,并对研究对象 进行统计分析、推断的科学。 (以期认识事物的规律性)

四、统计学对象的特点 1。随机性:发生的结果不确定,不同个体 有差异 2。群体性:多个物体(单一物体不需统计) 3。数量性:以数量表示事件

五、统计学应用 1. 气象预报,证券分析,产品寿命估计,抽样检验,保险、库存量估计、市场分析。 2. 识别、度量风险,企业的风险管理 3 五、统计学应用 1.气象预报,证券分析,产品寿命估计,抽样检验,保险、库存量估计、市场分析。 2.识别、度量风险,企业的风险管理 3.精算学:以统计学为基础,与金融学、保险理论结合。确定保费、盈余分配、出险规律。 4.新闻调查 总之,没有统计分析的管理是不完善的管理。

统计学的应用 审计员检查一个大公司的帐目,可以通过统计方法抽取帐目样本,根据样本结果确定该公司是否有帐目不清的问题。 小企业的经理在确定原材料的进货量时。需要考虑可能的原材料需求水平和原材料存储费用。为此他要做相应的调查。 经济学家需要根据消费者的购买模式,评价改变销售税对社会的影响。为此他需要通过实地调查,了解主要地区不同收入阶层消费者的购买模式。

统计学的应用 营销经理在决定是否销售一种新产品时,对样本顾客进行试销,并依据评价效果确定可能的销售水平。 投资经理依据咨询师的观点并考虑当前政策和企业现状,估计各种投资收益率出现的概率。 生产经理根据检验产品样本的质量情况,决定是否对生产过程作出必要的调整。

六、统计学的分类 1、描述统计学 数据的搜集、整理、显示和分析 2、推断统计学 利用概率论和数据对事物的数量规律性进行估计、检验等推断。由部分推断总体,由现在推断未来。

七、需注意的问题 抽样误差(不可避免),系统误差(可避免) 1.正确选方法 例如:从AB,去时速度20km/h, 返回速度30km/h 2.统计方法要与定性分析相结合, 统计方法要与其他学科的知识相结合。 例如:电视增加,犯罪增加,是必然? 3.防止系统误差 抽样误差(不可避免),系统误差(可避免) 例:调查读书欲望,调查交通工具

一、统计数据的收集 二、统计数据整理 三、集中趋势的测度 四、离散程度的测度 第二章 统计数据的描述 一、统计数据的收集 二、统计数据整理 三、集中趋势的测度 四、离散程度的测度

一、统计数据的收集(13页) 1、利用已有资料 出版物政府公报、期刊、专业数据库 教材14页列出了统计出版物 2、调查收集(collection through survey) 全面调查 非全面调查 重点调查 抽样调查(随机) 调查方式:观察、访问、表格(常用) 3、调查方案(survey plan) 目的;②对象;③项目;④时间;⑤方式;⑥领导; 费用;(见教材16页) 4、误差 抽样误差(不可避免);②系统误差(可避免)

二、统计数据的整理 1.总体与样本 总体(Population) 样本(Sample) 涉及的全体元素 总体的部分元素 总体容量 样本容量 总体中元素个数N 样本中元素个数n 总体用X,Y……大写 例:身高X,体重Y等 样本用x,y….. 小写 例:x1x2……,y1y2……

二、统计数据的整理(18页) 2、数据分组 按照某种标志,将数据分为几个部分 目的是:快速找出数据的规律性 ①次数分配 fi 次数——落在第i组的数据个数 例如,20页的次数分配表 ②分组的有关问题 a、组数k≈ b、组距取整数(便于计算) c、等距,不等距(调整次数= d、上下限要明确,保证数据不重、不漏

二、统计数据的整理 3.累积次数 Fi=? 例 F1=3 F2=10 F3=23 F4=28 F5=30 4.频率,累积频率 fi/n, Fi/n便于不同容量资料的比较

二、统计数据的整理 ①直方图 横轴——分组标志 (histogram)纵轴——次数(或频率) (参见21页) 通过直方图可了解: ①直方图 横轴——分组标志 (histogram)纵轴——次数(或频率) (参见21页) 通过直方图可了解: a、研究对象的总体规律 b、各分组段的比例 c、数据的分布范围

二、统计数据的整理 ②条形图 (1)进出口增长(见图片80页) (2)人口金字塔(81页) ③圆饼图(见图片84页) ④象形图 世界人口变化(见图片85、86页) ⑤Lorenz曲线(见教材23页)

90 91 92 93 94 95 96 作业:168个商店投资情况分析 万元 0-1 1-2 2-3 3-5 5-10 10-20 万元 0-1 1-2 2-3 3-5 5-10 10-20 个数 1 17 23 49 61 17 不等距情况应保证调整次数后,直方图面积不变。 下图是否直方图 6000万元 长话收入 (某地区) 90 91 92 93 94 95 96

三、集中趋势的测度 1.均值 性质 ① ② ③

三、集中趋势的测度 2.几何均值(Geometric mean) 适用于环比数据 例如:已知各年产值 a0,a1 ,a2,…,a5 X1=a1/a0,X2=a2/a1,X3=a3/a2,……,X5=a5/a4 称为环比数据。 求平均增长速度 有关系a5= a0Mg5

三、集中趋势的测度 3.调和均值(Harmonic mean) 此公式适用于两类变量的相对变化率数据 (例如:速度) 4.众数(Mode) 出现次数最多的数 5.中位数(Median) 排序数据的“中间值” 6.四分位数(Quartile) 位于 位的数(先排序) (考虑分组数据的以上指标)

四、离散程度的测度(32页) 1、极差:R=Xmax -Xmin 2、方差: (总体容量N) (样本容量n) 标准差 S=

四、离散程度的测度 对于分组数据 (xI为第i组的组中值) 方差另一种表达式 (可方便计算)

补充作业 调查一个村子中200个孩子的牙齿情况 A医生:在200人中抽20人,结果如下: 蛀牙数 0 1 2 3 4 5 6 7 8 9 10 孩子数 8 4 2 2 1 1 0 0 0 1 1 B医生:在200人中只记录了没有蛀牙的60名。估计村子里孩子总的蛀牙数: (1)用A的结果 (420) (2)用A,B的两种调查结果 (490)

第三章 概率及其分布(43页) (Probability and its distribution) 一、随机事件与概率 二、概率运算公式 三、随机变量及其分布 四、常用分布(61页) (此章内容为复习性质)

现实中的一些应用问题 需用到概率与统计的方法 例如: 预防性更换问题(寿命) 产品保换期的确定(寿命) 库存水平的确定(需求) (还有很多例子)

一、随机事件与概率 1、随机事件: 可能发生也可能不发生的结果。 基本事件是不可再分的随机事件。 (基本事件也称为样本点) 2、样本空间:样本点的全体 例:掷一个骰子: (等可能) 掷两个骰子: (不等可能)

一、随机事件与概率 3、事件的概率 古典概率: P(A)= m/n (样本点有限个,样本点等可能发生) “统计”概率:m/n(n次试验中,A出现m次) P(A)=m/n 主观概率:由经验确定的 公理化概率:(满足下列条件) a、对事件A有 0≤P(A)≤1 b、P(S)=1 c、Ai互斥(i=1,2,…,n),则∑P(Ai)=P(∑Ai)

二、概率运算公式(1/2) P(Ai)——先验概率 1、加法 P(A+B)=P(A)+P(B)-P(AB) 2、乘法P(AB)=P(A)P(B|A) 3、独立性 P(AB)=P(A)P(B) 4、全概率公式P(B)=P(A)P(B|A)+P( )P(B| ) 5、贝叶斯公式P(Ai|B)= P(Ai)——先验概率 P(Ai|B)——后验概率(在掌握信息后对P(Ai)调整)

二、概率运算公式 例如:已知,在严格控制下次品率为0.05, 在不严格控制下次品率为0.20 又根据历史情况知道: 90%的工作时间为严格控制 P(C) 10%的工作时间为不严格控制 P(C’) 现从工作现场抽取一件产品为次品。 P(C|D)=0.69<0.9=P(C) (称P(C)为先验概率) 根据抽样为次品的情况,我们直觉上也倾向于严格控制的比例在减少。 D----次品 (称P(C|D)为后验概率)

三、随机变量及其分布 (random variable and its distribution) r.v.—随机变量是用变量表示事件 1. r.v.特点 取值随机,取值的概率是确定的 r.v.分为连续、离散 习惯用X,Y….大写字母表示

三、随机变量及其分布 2、r.v.的分布 (1)离散r.v.分布 (discrete) X x1 x2…...Xn Pi P1 P2 Pn 也可写成P(X=xI)=表达式的形式 例如:= (掷骰子?)

三、随机变量及其分布 (2)连续r.v. X的分布(continuous) ①分布函数F(x)=P(X<x) 也可描述离散r.v. O≤F(x)≤1, F(x)↗ F(∞)=?,F(-∞)=? ②分布密度函数f(x) f(x)≥0,F(x)= =1 F’(x)=f(x)

三、随机变量及其分布 ③密度f(x)几何意义 ④X连续r.v.,则P(X=a)=0。故此时F(x)=P(X<x)=P(X≤x) ⑤求概率的方法: P(X≤a)=F(a) P(X>a)=1-F(a) P(a<X<b)=F(b)-F(a) 例:下面哪些式子是不可能的? P(X=6)=0.8 P(X=10)=1.3 F(3.2)=1.6 f(1.5)=0.8 F1(3)=0.5 F1(4)=0.4 f2(3)=1.6 f1(4)=1.0

四、常用分布(61页) (1)离散r.v的分布 ①两点分布 X 0 1 形式: pI 1-p p 常记q=1-p 背景:产品检验(合格取1,不合格取0) 打靶 (中靶取1,不中靶取0) 期望:E(X)=p 方差:D(X)=pq

四、常用分布(61页) ②超几何分布 形式:P(X=k)= , K=0,1,…,min(n,M) 背景:产品检验。从N个产品中取n个检验,(其中有M个合格品)求n中有k个合格品的概率。 (即X——合格品个数) 不放回! 期望:E(X)=nM/N=np 方差:D(X)=npq

四、常用分布(62页) ③二项分布 形式:P(X=k)见书 背景:在n次独立重复试验中, “A发生K次”的概率。 (P为在一次试验中A发生的概率) 有放回的试验! 期望:E(X)=np 方差:D(X)=npq

四、常用分布(62页) ④泊松分布 形式:P(X=k)见书, k=0,1,…..n,…… 背景: 单位时间内,电话交换台接到的呼叫次数X 期望=方差:E(X)=D(X)=λ

四、常用分布 例:62页例3.11 例:某单位每天用水正常的概率3/4,求“近六天 内有四天用水正常”的概率。(每天用水独立) 例:20部机器独立工作。已知1小时内每部机器故障概率0.01。求: “1小时内20部机器中有2部故障”的概率。 若有2人看此20部机器,求“至少1人空闲”的概率?

四、常用分布(62页) 例:72页习题6 关于超几何、二项、Poisson分布的近似关系: (1)当N大,n小(n/N<0.1)时,可用二项分布近似超几何分布(此时令P=M/N) (2)当n大,p小时,可用Poisson分布近似二项分布(取λ=np)。(n≥100,p≤0.01 np=1, 一般0.1<np<10即可)

四、常用分布(62页) (2) 连续r.v的分布 正态分布 形式:F(x)= f(x)= 背景:见63页 (1)实际应用,(2)理论近似 背景:见63页 (1)实际应用,(2)理论近似 期望:E(X)=u 方差:D(X)=σ2 记为N(u,σ2)

四、常用分布(63页) 正态分布密度函数的特点 对称的钟形 3σ=Δ P(|X-μ|<3σ)=0.9973 标准正态分布 ,记为N(0,1) 可查表知Φ(x)的值(430页) 标准化方法:F(x)=Φ( ) 例:Φ(1)=? Φ(1.1)=? Φ(1.11)=? P(X≤μ+σ)=F(μ+σ)= Φ(1)= P(μ-3σ<X<μ+3σ)=F(μ+3σ)-F(μ-3σ)=Φ(3)-Φ(-3)

四、常用分布 例题:见65页例3.12 例题: 预防性更换 确定更换时间t0使产品在t0时可靠度为0.90(t0称为可靠寿命) 解:设X—寿命服从正态分布N(20,32) 例题:确定产品的保用年限 见73页习题9

四、常用分布(66页) ②指数分布 形式:F(x)=1-e-λx,x≥0 f(x)=1-e-λx,x≥0 背景:电子产品的寿命、服务时间、顾客到 达间隔时间一般服从指数分布。 期望:E(X) = 1/λ 方差:D(X) = 1/λ2

四、常用分布(66页) ③均匀分布 形式:F(x)= 0 x<a a≤x≤b 1 x≥b f(x)= 1/b-a a<x<b 其它 背景:特定情况下 期望:E(X)=(a+b)/2 方差:D(X)=(b-a)2/12

概率的应用 例:某汽车加油站每周补充一次汽油。现在要确定此加油站储油库的最少容油体积,使得在一周内加油站的油售完的概率不大于0.01。要解决此问题,应考虑哪些因素,应如何收集数据,应采用什么统计方法,建立什么概率模型?

对问题的讨论(确定储油量的例子) 1、要明确随机变量X。显然X为“加油站每周的售油量(单位:KL)”,此为连续型随机变量。 2、要确定X服从的分布函数F(x)或分布密度f(x)。 若F(x)或f(x)未知,则应收集加油站每周的售油量的历史数据x1 ,x2, ……xn,绘制直方图,以此粗略判断分布类型。然后,用统计方法进行拟合优度检验。最后确定分布形式F(x)或f(x)。

(接上页) 3、若F(x)或f(x)已知,设 f(x)=C(1-x)3 0<x<1 (C为待定常数) 0 其它 这里首先需要确定C为多少?根据分布密度性质,C应满足 ,由此可推出C=4。然后,建立概率模 型为:P(X>t0)= 即(1- t0)4≤0.001 , t0≥1- =0.6838(KL) 因此,储油库容油体积至少为684L才能保证在一周内售完油的概率不大于0.001。

概率的应用 例:某药品反应率为0.0001。现有2万人使用此药。求这2万人中发生过敏反应的人数不超过3人的概率。 解:X——2万人中发生过敏反应的人数 P(X≤3)=P(X=0)+P(X=1)+P(X=2)+P(X=3) 用什么分布?

例:产品合格标准。若使产品(布)的合格率达98%,则单位面积的疵点数最多定为多少为合格标准x0 ? P(X≤x0)=0.98= 1+3+9/2 +27/6 +81/24+81*5/24*5 +1.0125≥19.68(i=7)

概率的应用 例:在前面“预防性更换”的题目中,若寿命X服从指数分布,情况会如何? 例:门的高度确定? 例:60岁健康人,5年内死亡的概率为P,保险公司办理5年保险交a元。死亡则赔b元。a=?b=?使公司获利。 X a a-b 解: P 1-P P a-bP≥0 ∴a<b<a/P

例:无人售票的可行性? 例:一项工程项目能否在26天(规定时间内)完成? (已知施工完成时间X∽?) 上面例题中涉及到的参数,均需由实际调查、试验数据确定。需依靠统计方法解决。一般密度函数f(x)与直方图相对应。

第四章 参数估计与假设检验 一、抽样的基本概念 二、抽样分布 三、参数估计

一、抽样的基本概念(Sampling) 1、样本的两重性(总体X) 抽样前样本看成随机变量 X1 ,X2 ……Xn 2、简单随机样本 ①X1 ,……Xn与总体X有同分布 ②X1 ,……Xn相互独立 (independent identity distributions:iid) 3、样本统计量 样本的函数( ,S2等),也有两重性。 统计量服从的分布——抽样分布

二、抽样分布 抽样分布一般较复杂,但对于正态总体较简单。 χ20.05(10)=18.307 1. X1 …..Xn iid 于N(μ,σ2),则X∽N(μ, ) (在大样本时,(n≥30),可不做总体的正态假设) 2. χ2分布(见76页)(不对称分布) X1……. Xn iid N(0,1),则χ2 =∑Xi2∽ χ2(n) 其中n—自由度 df (degree of freedom) 一般求χ2 :P(χ2 (n)> χ2 )= , (查表433页) 例: =0.05, n=10 χ20.05(10)=18.307

二、抽样分布 Sampling distribution (是对称分布 symmetrical distributiom n≥30时,近似正态分布) 有自由度要求 经常求:t/2 双侧百分位数:P(T> t/2)=  t 单侧百分位数:P(T>t)= (查表434页) 例:=0.1 t/2(21)=1.721, t (21)=1.323

三、参数估计 (用样本对分布中的参数加以推断) 1、点估计 代替法:用频率代替概率 用样本特征代替总体特征值 (总体特征包括:均值、方差等) 注意:①用此法时,需知道总体特征与参数的关系 ②样本均值 样本方差

三、参数估计 例如:X∽N(μ,σ2),则 ( 表示参数μ的点估计值,其他参数同样解释) ( 表示参数μ的点估计值,其他参数同样解释) 例如:X∽指数分布F(x)=1-e-λx,均值为1/λ 则 ∴ 例如:X∽[a,b]上均匀分布,则 = , 由这两个式子求出

三、参数估计 2、估计量的标准 无偏性 E( )= 例如: 、中位数都是均值参数(μ)的无偏估计。S2是方差参数(σ2)的无偏估计。 有效性:参数θ的两个无偏估计θ1,θ2,若 E(θ1-θ)2≤E(θ2-θ)2,则称θ1比θ2有效。 例如, 比中位数有效。 为均值参数的“最小方差无偏估计”。

三、参数估计 3.区间估计 思想:确定一个区间,保证以很大概率使参数落入该区间中。 (此区间一般应包含参数的点估计) 例:设x1 ,x2…… ,xn是来自于总体N(μ,32)的 样本,试确定区间,使其有95%把握包含参数μ。

三、参数估计 解:已知 服从N(0,1)。 由于 可查正态分布表得出 因此,有 其中 称为置信度, 包含μ的区间,称为置信区间。

均值  的区间估计 设 X1 …..Xn iid 于N(μ,σ2), 为μ的点估计,求置信度为 1- 的 μ 的置信区间。 σ已知时: 由于 z= 服从N(0,1), 得到置信区间 说明:对于非正态总体,当 n > 50 时,仍可用 z 统计量进行区间估计,并用 S 代替σ(见89页例4.5)。

总体均值  的区间估计 σ未知时:σ未知时(小样本) 已知 t = 服从 t(n-1) 分布, 得置信区间 例题见90页(例4.6) 得置信区间 例题见90页(例4.6) 一般对称区间时,置信区间最短。

推荐网站: 北京大学中国经济研究中心——双学位讲义中的《商务与经济统计》。 网址:http://www1.ccer.edu.cn/jydown/

样本容量的确定 [在正态总体下(非正态不易处理)均值区间估计时的样本容量n的确定方法] 若规定区间宽度为2△(△为 偏差,允许误差)则有 问题:当区间减少一半时,n增加多少?

在点估计中用无偏性、有效性(方差大小)衡量估计量的优劣。 在区间估计中用置信度、样本容量及区间宽度衡量优劣。 有关系:  n不变,1-α增大,则 增大,即宽度增大,精度下降。所以追求置信度高,则影响精度。  1-α不变, n增大,则宽度减小,精度上升。 但是,如果n太大,会造成浪费,失去抽样意义,因此,精度的选取要适当。

例:5000人中抽100人,计算出 平均月 收入800 元。 ①求这5000人中平均月收入范围 (取 =0.99,σ=10) ② △最大偏差是多少? ③ 不变,使△减少 ,n为多少? ④△不变,使 =0.95,n为多少? 1-α 1-α 1-α

① =2.576, △= =2.576 3, ∴ ② △= 2.576 ③n=225 ④n= 57.89

背景:随机抽取的n个产品中有k件次品,则次品率的点估计为 现有结论: 近似地有: 得p的置信区间为: 例题见 91页——例4.7

两总体均值差的区间估计(见92页,此部分自学) 正态总体方差 的区间估计 设 iid N(μ,σ2), S2为σ2的点估计,求置信度1-的置信区间。 已知 查表求

得 的置信区间: 例题 97页——例4.10 ( 没有在教材后的表中,可在其 他书中找)

两个正态总体方差比的区间估计( ) 从 两个总体中独立各取样本,样本方差分别为 , ,现 对 做区间估计。

已知 , , , 得到:

此区间估计常用来比较方差大小,当上限1,下限1时,不能做比较,需用其他方法。 例题:见97页——例4.11 参数区间估计小结表见99页——100页。 查 ,

四、假设检验(Testing Hypothesis) 统计推断的又一类问题,对问题得出“是”与“否”的结论。 背景: ①改进加工工艺后,产品的平均尺寸是 否显著变化?(原尺寸 改进 工艺后,取10件测量, ) ②改进工艺后,生产是否稳定?( 是 否显著变化? ③合格率是否符合规定? ④产品寿命是否符合正态分布?

对以上问题,可分别假设: ① :没有显著变化, ② :稳定, ③ :符合规定 ④ :服从正态 然后根据样本,判定 是否正确,若正确,接受 ,否则拒绝 。这就是假设检验的内容。 一般把要检验的假设称为原假设(零假设 ),与原假设相反的假设称为备择假设 。

理论依据:“小概率原理”——小概率事件在一次试验中几乎不发生。 1.假设检验的思想: 举例: 已知在总体 时,若 成 立,即 则应有 已知在总体 时,若 成 立,即 则应有 (即以很大概率出现,相反的不等式对应的事件以小概率出现)

现经抽样 ,计算 若 ,则没有矛盾。 若 ,说明“小概率”事 件在一次试验中出现了。这是与小概率原理矛盾的,说明 错了。 2.假设检验的步骤: a.建立原假设(及备择假设) b.确定显著性水平 表明:当零假设正确时,拒绝 的概率 是 [弃真错误]

c.选择统计量 (例如: , d.计算统计量的值,与临界值做比较 若超出临界值,则拒绝 若小于临界值,则接受 若等于临界值,则加大样本容量。

3.检验的内容(104-111页) ①总体均值的假设检验 , (已知数) 已知时,用z统计量 未知时,用t统计量(用s代替 ) (例题见104页,例4.13) 大样本时( ),不论总体为何种分布,均可用z统计量近似。

②两正态总体均值是否相等的检验 , , 已知时,用z统计量 未知时,用t统计量(且要求 可用 代替 )。 大样本时( ),不论总体为何种分 布,均可用z统计量分析。 (例题,105页——例4.14)

③总体方差的假设检验 统计量, 查表,得 若 ,则接受原假设; 若反之,则拒绝原假设。 例题,见106页,例4.15

其他检验内容略。 汇总表(Hypothesis Testing),见108-111页。 作业:112-115页 4、5、6、8、10(1)(2)、12、 13、14

1993,1994年上证所商业类上市公司净资产收益率之间是否有显著性差异? 4.假设检验的例子 1993,1994年上证所商业类上市公司净资产收益率之间是否有显著性差异? 解:设收益率 , 第一食品 新世界 东北华联 济南百货 1993年(1) 7.9 5.6 7.75 11.00 1994年(2) 12.35 13.96 1.23 6.16

方法1: 处理数据: -4.45,-8.36,6.52,4.84(n=4) (没差异), 统计量 计算 经比较 ,故没显著差异。

方法2:直接用105页的公式。但前提是 两总体方差相等。此题中对是否 两总体方差相等是不清楚的,故 不宜使用此公式。若可证明两总 体方差相等,则可用此方法。 关于两总体方差相等的检验见(106-107页)。 说明:此例子用方法1处理的前提是两个样本容量相同。

两校新生学习(高等数学)成绩 是否有差异?(成绩服从正态分布) 解释计算结果: ①93-94年,上证所上市类公司净资产收 益率之间没有显著差异。 ②将没差异判断为有差异的可能性是5%。 此例摘自《数理统计与管理》杂志97年第4期。 补充作业: 两校新生学习(高等数学)成绩 是否有差异?(成绩服从正态分布) 甲校 11名 乙校 11名

5.两类错误 不变多少,在拒绝 时,均会有失误(随机因素造成的),称之为弃真错误,也称为第一类错误、供货方风险。还有一类取伪错误 ,也称为第二类错误、使用方风险。一般控制 情况较多,本课中不讨论 的计算问题。

两类错误 的示意图 ( 与 不可能同时减小)

6.点估计、区间估计、假设检验的用途 ① 主要用于确定分布函数中 的参数。 ② 主要用于估计指标的范围 (例如城市人口、平均消费量等), 还可用于确定样本容量。 ③ 主要用于同以往情况的比 较,用于不同总体的比较,两者差异 的判断。

例如,公安系统破案时,对现场的脚印、步幅等同嫌疑人做比较。 7.单侧假设检验 (略)

第六章 回归分析 一、变量之间的关系 a.函数关系 X→Y ,例如y=lnx (一一对应) b.相关关系(统计关系) x与y有依存,但y不是由x唯一确定的。 (有对应,但不唯一确定) 例:价格——需求量 气温——冷饮、空调需求量

回归分析:根据观测数据,对具有统计关系的变量建立回归模型,并进行统计推断。 解决以下问题: ①确定变量间是否有统计关系(相关关系),若有,找出表达式; ②根据一个或一组变量的值,预测另一个变量的值。

回归模型的种类 单变量 多变量 线性 非线性

二、一元线性回归(Simple Linear Regression) 例: X—价格,Y—产品需求量, 测得数据:

1.散点图(Scatter plot) 由图设想用 近似表示X、Y的相关关系。 y与 有差别。 2.回归方程 。