Download presentation
Presentation is loading. Please wait.
1
第四章 集中趋势测量法 算术平均数 主 要 内 容 中位数 众数 几何平均数和调和平均数
2
统计分析首先要解决的问题,就是寻求一个简单数值以代表搜集所得的资料。
平均指标就是表明同质总体在一定条件下某一数量标志所达到的一般水平。 平均指标把总体各单位之间的差异加以抽象概括,其中个别标志值的偶然性被相互抵消,从而反映出总体分布的集中趋势。
3
下面是一个小故事: 一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?
4
挠头的数值 公司员工的月薪如下: 员工 经理 副经理 职员A 职员B 职员C 职员D 职员E 职员F 职员G 6000 4000 1700
月薪(元) 6000 4000 1700 1300 1200 1100 500
5
我们有三种方法选择集中趋势: (1)根据频数:哪个变量值出现次数越 多,就选择哪个变量值,比如民主决策的表决 机制。 (2)根据居中:比如一个城镇居民的生活 水平,居中的是小康家庭,那么就用小康家庭 来代表该城镇的生活水平。 (3)根据平均:用平均数来代表变量的 平均水平。
6
关于集中趋势的一个故事 吉斯莫先生有一个小工厂,生产超级小玩意儿。
管理人员由吉斯莫先生、他的弟弟、六个亲戚组成。工作人员由5个领工和10个工人组成。工厂经营得很顺利,现在需要一个新工人。 现在吉斯莫先生正在接见萨姆,谈工作问题。
7
吉斯莫:我们这里报酬不错。平均薪金是每周300美元。你在学徒期间每周得75美元,不过很快就可以加工资。
萨姆工作了几天之后,要求见厂长。 萨姆;你欺骗我!我已经找其他工人核对过了,没有一个人的工资超过每周100元。平均工资怎么可能是一周300元呢? 吉斯莫:啊,萨姆,不要激动。平均工资是300元。我要向你证明这一点。
8
吉斯莫:这是我每周付出的酬金。我得2400元,我弟弟得1000元,我的六个亲戚每人得250元,五个领工每人得200元,10个工人每人100元。总共是每周6900元,付给23个人,对吧?
萨姆:对,对,对!你是对的,平均工资是每周300元。可你还是蒙骗了我。 吉斯莫;我不同意!你实在是不明白。我已经把工资列了个表,并告诉了你,工资的中位数是200元,可这不是平均工资,而是中等工资。
9
萨姆:每周100元又是怎么回事呢? 吉斯莫:那称为众数,是大多数人挣的工资。 吉斯莫:老弟,你的问题是出在你不懂平均数、中位数和众数之间的区别。 萨姆:好,现在我可懂了。我……我辞职!
10
第一节 算术平均数(MEAN) 用总体标志总量除以总体单位数即得 算术平均数(Arithematic mean)。 算术平均数是反映集中趋
势最常用、最基本的平均指标, 也被称为均值。它只适用于定 距以上的变量。
11
例:某小区350户家庭共有居民1190人。在 这个例子中,家庭总数350户是总体单位数,居 民总数1190人是该总体的标志总量。根据算术 平均数的定义 户均人口= = 3.4(人)
12
1. 对于未分组资料 注意:对求和符号,此时流动脚标的变动范围是1, 2, 3, … ,N ,N是总体单位数。
1. 对于未分组资料 注意:对求和符号,此时流动脚标的变动范围是1, 2, 3, … ,N ,N是总体单位数。 [例] 求74、85、69、9l、87、74、69这些数字的算术平均数。 [解] = =78.4
13
2. 对于分组资料 注意:对求和符号,此时流动脚标的变动范围是1,2,3 … ,n, n是组数,而不是总体单位数。 很显然,算术平均数不仅受各变量值(X)大小的影 响,而且受各组单位数(频数)的影响。由于对于总体的影 响要由频数( f )大小所决定,所以 f 也被称为权数。值得 注意的是,在统计计算中,权数不仅用来衡量总体中各标 志值在总体中作用,同时反映了指标的结构,所以它有两 种表现形式:绝对数(频数)和相对数(频率)。这样一 来,在统计学中,凡对应于分组资料的计算式,都被称为 加权式。
14
[例] 求下表(单项数列)所示数据的算术平均数 。
人口数(X) 户数(f) 频率(P) 2 3 4 5 6 7 8 16 10 1 0.10 0.16 0.32 0.20 0.12 0.08 0.02 合计 50 1.00
15
对于组距数列,要用每一组的组中值权充该 组统一的变量值。 [例] 求下表所示数据的的算术平均数 间距 频数(f) 组中值(X)
148―152 152―156 156―160 160―164 164―168 168―172 172―176 176―180 180―184 184―188 188―192 192―196 1 2 5 10 19 25 17 12 3 150 154 158 162 166 170 174 178 182 186 190 194 合计 100 ——
16
各变量值对算术平均数的平方和,小于它们对任
3. 算术平均数的性质 各变量值与算术平均数的离差之和等于0。 各变量值对算术平均数的平方和,小于它们对任 何他数偏差的平方和。 算术平均数受抽样变动影响较小。 受极端值影响较大。 分组资料如遇有开放组距时,不经特殊处理 不能进行算术平均数的计算。
17
第二节 中位数(Median) 把总体单位某一数量标志的各个数值按大小顺序排列,位于正中处的变量值,即为中位数,用Md表示。 Md可用于定序、定距、定比资料。
18
1. 对未分组资料 (1) 先把所有数据按大小顺序排列,如果总体单位数为奇数,则取第(N+1)/2 位上的变量值为中位数; (2)如果总体单位数为偶数。因为居中的数值不存在,按惯例,取第 N/2位和第(N+1)/2 位上的两个变量值的平均作为中位数。
19
你会吗? 例:求54,65,78,66,43这些数字的中位数。 例:求54,65,78,66,43,38 这些数字的中位数。
20
2. 对于分组资料 (1)单项数列 根据N/2在累计频数分布中找到中位数所在组, 该组变量值就是Md 。 中 位 数
21
(2)组距数列 按中位数所在组的下限: 按中位数所在组的上限:
(2)组距数列 按中位数所在组的下限: 按中位数所在组的上限: 当根据组距数列求中位数时,要采用所谓的比例插值法:先根据N/2在累计频数分布中找到中位数所在组,然后假定该组中各变量值是均匀分布的,再用以下任何一种方法求出中位数(注意:此处用的是向上累计)。
22
[例]某年级学生身高如下,求中位数
23
[解] 第一种方法 =168+ ×6 =171.12(厘米) 请你用第二种方法来做一下
24
3. 中位数的性质 (1)各变量值对中位数之差的绝对值总和, 小于它们对任何其他数的绝对值总和。 (2)中位数不受极端值的影响。
3. 中位数的性质 (1)各变量值对中位数之差的绝对值总和, 小于它们对任何其他数的绝对值总和。 (2)中位数不受极端值的影响。 (3)分组资料有不确定组距时,仍可求得 中位数。 (4)中位数受抽样变动的影响较算术平均 数略大。
25
中位数所有单位被等分为两部分,因而被称为二分
4. 四分位数 中位数所有单位被等分为两部分,因而被称为二分 位数。类似于求中位数,我们还可求出四分位数、十分 位数、百分位数。 将总体中的各单位分割成相等的四部分,则这三个 分割的变量值就是四分位数。若以Q1、Q2、Q3分别代表 第一、第二、第三四分位数。Q2 即中位数,Q1、Q3的算 法分别是
26
请从下表中指出第一四分位数和第三四分位数
27
求出下表中的第一四分位数和第三四分数
28
第三节 众数(Mode) 众数是在一组资料中,出现次数(或频 数)呈现出“峰”值的那些变量值,用Mo表示。
众数只与次数有关,可以用于定类、定序、定距、定比资料。
29
直接观察 1. 对于未分组资料 首先,将所有数据顺序排列;然后,只要 观察到某些变量值(与相邻变量值相比较)出现
1. 对于未分组资料 直接观察 首先,将所有数据顺序排列;然后,只要 观察到某些变量值(与相邻变量值相比较)出现 的次数(或频数)呈现“峰”值,这些变量值就是 众数。
30
2. 对于分组资料 单项式:观察频数分布 (或频率分布 ) 组距式: Lo为众数组下限; Δ1为众数组频数与前一组频数之差;
2. 对于分组资料 单项式:观察频数分布 (或频率分布 ) 组距式: Lo为众数组下限; Δ1为众数组频数与前一组频数之差; Δ2为众数组频数与后一组频数之差; ho 为众数组组距。
31
求下表中的众数 人口数(X) 户数(f) 频率(P) 合计 50 1.00 众数 2 3 4 5 6 7 8 16 10 1 0.10
0.16 0.32 0.20 0.12 0.08 0.02 合计 50 1.00 众数
32
求下表中的众数
33
3. 众数的性质 (1)众数仅受上下相邻两组频数大小的影响,不受极端值影响,对开口组仍可计算众数; (2)受抽样变动影响大; (3)众数不唯一确定。 (4)众数标示为其峰值所对应的变量值,能很容易区分出单峰、多峰。因而具有明显偏态集中趋势的频数分布,用众数最合适。
34
第四节 几何平均数、调和平均数(了解) 1. 几何平均数Mg (geometric mean )
第四节 几何平均数、调和平均数(了解) 1. 几何平均数Mg (geometric mean ) N个变量值连乘积的N次方根。(不能有变量值为 0)。适用于:(1) 计算某种比率的平均数;(2) 计算大 致具有几何级数关系的一组数字的平均数,如经济指标 的平均发展速度。 (1)简单几何平均数 对数式:
35
(2) 加权几何平均数 对数式: 应该指出,用以计算几何平均数的各项数值必须 大于0,否则就不能计算几何平均数或计算结果无实 际意义。
36
[例] 求3,9,27,81,243这些数字的几何平均数。 [解] (1) (2)
37
2. 调和平均数Mh ( harmonic mean)
数。适用于:掌握的情况是总体标志总量而缺少总体 单位数的资料时。 简单调和平均数 加权调和平均数
38
3. 各种平均数的关系 (1) 当总体呈正态分布时: (2)当总体呈偏态分布时:中位数总在均数和众数之间 正偏: 负偏:
正偏: 负偏: (注: 和 合称位置平均数) (3) 皮尔逊发现,在钟形分布的偏态不大显著时, 、 、 三者大致构成一个比较固定的关系: (4) 、 和 合称数值平均数
Similar presentations