第三章平均数、标准差与变异系数第一节平均数上一张下一张主页退出.

Slides:

Advertisements

Similar presentations

简单迭代法的概念与结论简单迭代法又称逐次迭代法，基本思想是构造不动点方程，以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式，返回下一页则称迭代格式收敛, 否则称为发散上一页.

Advertisements

浦江二中钱咏梅. 垂体甲状腺胸腺肾上腺胰岛卵巢（女性）睾丸（男性）人体主要的内分泌腺性腺性腺｝

护理病历题目：Ⅱ型糖尿病患者的护理实习护士梁佩霞病历指导教师石姝梅老师专业负责人胡宪法老师实习医院顺德区第一人民医院.

统计与可能性总复习第六单元统计与可能性一、 1 ）抛一枚硬币，有（）可能，分别是（）和（）。出现正面的可能性是（）。 2 ）某人抛硬币连续 5 次都正面朝上，那么第 6 次抛硬币正面朝上的可能性（），如果抛 60 次，正面朝上可能是（）次，反面朝上是（）次。两种.

50912 吳明杰獅子. 公獅經常在晨曦和傍晚時分吼叫，主要是宣示主權。獅子是貓科動物中唯一的群居品種，獅群捕獵：獅子狩獵時會集體行動，牠們常用的方式是幾頭獅子先在有利的地方埋伏，另一頭獅子則公然追趕獵物，目的是把獵物驅趕往埋伏好的獅子附近。獅子喜歡在晚間狩獵，這樣可以提高成功率。公獅.

嬰幼兒的發展與保育. 嬰幼兒外觀的發展一、身高體重 1. 出生 6 個月內的嬰兒每個月增加 0.5-1kg 2. 1 歲時約 10kg 3. 1 歲比出生時的身高約多了 50% ， 4 歲時達出生時身長的 2 倍 4. 一般而言, 食用母奶的嬰兒較配方奶的嬰兒發展較為緩慢 5. 身高體重低於 25%

（ 1 ）用秤可以称出物体的（）。（ 2 ）表示物体有多重，可以用（）和（）作单位，物体较轻时用（），物体较重时用（）。 “ 克 ” 用 “g” 表示； “ 千克 ” 用 “kg” 表示. 质量克千克克（ 3 ） 1 千克 = （）克 5000 克 = （）千克 1 千克.

窦娥冤关汉卿感天动地元·关汉卿.

专利技术交底书的撰写方法 ——公司知识产权讲座

第五章话语的语用意义(上) 主讲人：周明强.

大南海文化園區 (國立歷史博物館 -初期計畫) 簡介

我的家乡南通 ….

中国医科大学法医学院血清学教研室刘利民教授

当代国际关系（案例6）冷战时期美苏关系的演变.

青春花季拒绝香烟 12机电大专（1）班主题班会.

人群健康研究的统计方法预防医学系指导教师：方亚电话：

2000年7月5日星期三口语复习课教务处公开示范课制作、授课：郑艳群.

資料的描述: 在研讀完本章之後，您應當能夠進行下列事項: CHAPTER 3 目標位置和離差的測量

第一章生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系，其涉及哪些内容 1.

知其不可而为之.

第三章生产活动与地域联系第二节工业区位.

中国画家协会理事、安徽省美术家协会会员、工艺美术师、黄山市邮协常务理事余承平主讲

主办:泰兴市质量强市领导小组办公室承办：泰兴市市场监督管理局.

通榆县养殖技术培训班中国肉牛选育及杂种优势利用张国梁国家肉牛牦牛产业技术体系 2015年8月27日.

第一讲食用菌的营养价值和药用价值.

汉字的构造.

诵读欣赏古代诗词三首.

巫山职教中心欢迎您 1.

战后国际关系专题五：冷战时期美苏关系的演变政治学与行政管理系.

第十一章　理气剂.

四种命题班级：C274 指导教师：钟志勤任课教师：颜小娟.

第三节固精缩尿止带药 1．特点：酸涩收敛，主归肾、膀胱经。 2．功效：固精、缩尿、止带。兼补肾。

第三章资料的统计描述上一张下一张主页退出.

第十九章货币均衡一、本章主要内容与结构安排货币供求均衡与社会总供求平衡货币均衡通货膨胀通货紧缩.

五、学习方法及应考对策（一）学习方法 1．保证复习时间，吃透教材：上课之前应该对课程相关内容进行预习，把不理解的问题记录下来，带着问题听课。考试之前务必把课本看3遍以上，第一遍一定要精读，最好能做笔记，边读边记，不要快，要记牢。第二、三遍可以查缺补漏型的看，通过做题目看书，加深课本印象。 2．加强概念、理论性内容的重复记忆：概念、理论性内容一般比较抽象，所以在理解的基础上一定要重复记忆，在接受辅导之后，再加以重点记忆，以便及时巩固所学内容，切忌走马观花似的复习，既浪费时间，效果也不好。

欢迎各位领导莅临指导超重和失重主讲人: 李东红.

7-1 能量的形式和轉換 1 of 12 能量是促成自然現象變化的根源，太陽能替我們將水搬到高處，人類再利用高、低水位差發電。

口腔需求品類 -以家樂福為例指導老師：莊勝雄老師組員：497D0033 邱郁閔 497D0086 陳育嘉 497D0092 黃靜宜

《生活与哲学》第一轮复习第七课唯物辩证法的联系观.

贴近教学服务师生方便老师.

六年级语文下册第四单元指尖的世界.

湖南农业大学农业航空团队研究成果航空作业机型湖南农业大学农业航空研究中心成果专栏 ◎团队简介

“食品公司”.

（浙教版）四年级品德与社会下册共同生活的世界第四单元世界之窗第二课时.

第十四章数值变量的统计描述.

第三章統計資料之分析解釋(一).

本章重點：一、集中量數的意義和種類二、算術平均數三、中位數（中數）四、眾數五、其他集中量數六、SPSS12.0實務操作

統計量數集中趨勢量數離散趨勢量數相對位置量數分配形態量數.

敍述統計學許明宗.

貨幣需求與貨幣市場的均衡.

导数的应用 ——函数的单调性与极值.

棠外附小三年级数学下册口算大王比赛请你在10秒钟内做好准备！.

萬有引力 =一種令兩個或以上物體互相吸引的力量。 →地心吸力，令人們有「重量」感 →星體引力，令星體之間維持平衡，保持一定距離

第七章调查数据的分析第一节数据集中趋势的测定第二节数据离散程度的测定第三节动态数据的分析第四节相关与回归分析.

商業行為成立的要件動動腦 Q 請試著判斷下列何者為商業行為？請試著判斷下列何者為商業行為？.

第四章集中趋势测量法算术平均数主要内容中位数众数几何平均数和调和平均数.

总体特征数的估计.

職災案例指導教師：楊慶章學生：許承霖、吳鎮廷、孔張孔大仁科技大學環境與職業安全衛生系

线性代数电子课件西安石油大学理学院工程数学教研室制作.

第一单元　四则运算乘、除法的定义及各部分间的关系北京市东城区府学胡同小学　吴建成.

Xián 伯牙绝弦安徽淮南市八公山区第二小学　陈燕朵.

家禽生产与疾病防治任务一肉鸡品种的选择家禽生产与疾病防治课程组 2019年5月24日1时52分.

危险化学品事故调查实例系列讲座③ 鞭炮厂大爆炸侦破记赵铸新主讲

生物统计学 Biostatistics 第一章统计数据的收集与整理

多姿多彩的世界.

106年免試入學第一次模擬選填重要日程表說明 1.106年1月10日中午12時～106年1月16日中午12時完成第一次模擬

习惯跑步徐凤林北京大学哲学系 2019年5月29日.

Presentation transcript:

第三章平均数、标准差与变异系数第一节平均数上一张下一张主页退出

平均数是统计学中最常用的统计量，用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有：算术平均数（arithmetic mean）中位数（median）众数（mode）几何平均数（geometric mean）调和平均数（harmonic mean）上一张下一张主页退出

算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数，记为。一、算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数，记为。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法主要用于样本含量n≤30以下、未经分组资料平均数的计算。上一张下一张主页退出

设某一资料包含n个观测值： x1、x2、…、xn，则样本平均数可通过下式计算：（3-1）其中，Σ为总和符号；表示从第一个观测值x1累加到第n个观测值xn。当在意义上已明确时，可简写为Σx，（3-1）式可改写为：上一张下一张主页退出

【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490（kg），求其平均数。由于 Σx=500+520+535+560+58 +600+480+510+505+49 =5285， n=10 上一张下一张主页退出

对于样本含量 n≥30 以上且已分组的资料，可以在次数分布表的基础上采用加权法计算平均数，计算公式为：得：即10头种公牛平均体重为528.5 kg。（二）加权法对于样本含量 n≥30 以上且已分组的资料，可以在次数分布表的基础上采用加权法计算平均数，计算公式为：（3-2）上一张下一张主页退出

第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量，因此将fi 称为是xi的“权”，加权法也由此而得名。 —分组数第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量，因此将fi 称为是xi的“权”，加权法也由此而得名。【例3.2】将100头长白母猪的仔猪一月窝重（单位：kg）资料整理成次数分布表如下，求其加权数平均数。上一张下一张主页退出

表3—1 100头长白母猪仔猪一月窝重次数分布表上一张下一张主页退出

即这100头长白母猪仔猪一月龄平均窝重为45.2kg。利用（3—2）式得：即这100头长白母猪仔猪一月龄平均窝重为45.2kg。计算若干个来自同一总体的样本平均数的平均数时，如果样本含量不等，也应采用加权法计算。上一张下一张主页退出

此例两个牛群所包含的牛的头数不等，要计算两个牛群混合后的平均体重，应以两个牛群牛的头数为权，求两个牛群平均体重的加权平均数，即【例3.3】某牛群有黑白花奶牛 1500头，其平均体重为750 kg ，而另一牛群有黑白花奶牛1200头，平均体重为725 kg，如果将这两个牛群混合在一起，其混合后平均体重为多少？此例两个牛群所包含的牛的头数不等，要计算两个牛群混合后的平均体重，应以两个牛群牛的头数为权，求两个牛群平均体重的加权平均数，即上一张下一张主页退出

1、样本各观测值与平均数之差的和为零，即离均差之和等于零。即两个牛群混合后平均体重为738.89 kg。（三）平均数的基本性质 1、样本各观测值与平均数之差的和为零，即离均差之和等于零。或简写成上一张下一张主页退出

2、样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。 (xi- )2 < (xi- a)2 （常数a≠ ）或简写为： < 对于总体而言，通常用μ表示总体平均数，有限总体的平均数为：（3-3）上一张下一张主页退出

当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。式中，N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数（）作为总体平均数（μ）的估计量，并已证明样本平均数是总体平均数μ的无偏估计量。上一张下一张主页退出

将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。二、中位数将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。上一张下一张主页退出

对于未分组资料，先将各观测值由小到大依次排列。（一）未分组资料中位数的计算方法对于未分组资料，先将各观测值由小到大依次排列。上一张下一张主页退出

1、当观测值个数n为奇数时，(n+1)/2位置的观测值，即x(n+1)/2为中位数： Md= 2、当观测值个数为偶数时， n/2和（n/2+1）位置的两个观测值之和的1/2为中位数，即：（3-4）上一张下一张主页退出

【例3.4】观察得9只西农莎能奶山羊的妊娠天数为 144 、 145、 147、 149、150、151、153、156、157，求其中位数。此例 n=9，为奇数，则： Md= =150（天）即西农莎能奶山羊妊娠天数的中位数为150天。上一张下一张主页退出

【例3.5】某犬场发生犬瘟热，观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天，求其中位数。【例3.5】某犬场发生犬瘟热，观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天，求其中位数。此例n=10，为偶数，则： (天) 即10只仔犬从发现症状到死亡天数的中位数为11.5天。（二）已分组资料中位数的计算方法上一张下一张主页退出

若资料已分组，编制成次数分布表，则可利用次数分布表来计算中位数，其计算公式为：（3—5）式中：L — 中位数所在组的下限； i — 组距； f — 中位数所在组的次数； n — 总次数； c — 小于中数所在组的累加次数。上一张下一张主页退出

【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表如表 3—2 所示，求中位数。【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表如表 3—2 所示，求中位数。表3—2 68头母牛从分娩到第一次发情间隔时间次数分布表上一张下一张主页退出

即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。由表3—2可见：i=15，n=68，因而中位数只能在累加头数为36所对应的“57—71”这一组，于是可确定L=57，f=20，c=16，代入公式（3—5）得： (天) 即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。上一张下一张主页退出

三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根，称为几何平均数，记为G。它主要应用于畜牧业、水产业的生产动态分析，畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长率，抗体的滴度，药物的效价，畜禽疾病的潜伏期等，用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下： (3-6) 上一张下一张主页退出

为了计算方便，可将各观测值取对数后相加除以n，得lgG，再求lgG的反对数，即得G值，即 (3-7) 【例3.7】某波尔山羊群1997—2000年各年度的存栏数见表3—3，试求其年平均增长率。上一张下一张主页退出

表3—3 某波尔山羊群各年度存栏数与增长率上一张下一张主页退出

利用（3—7）式求年平均增长率 G= =lg-1[（-0.368-0.398–0.602）] =lg-1（-0.456）=0.3501 即年平均增长率为0.3501或35.01%。上一张下一张主页退出

资料中出现次数最多的那个观测值或次数最多一组的组中值，称为众数，记为M0。四、众数资料中出现次数最多的那个观测值或次数最多一组的组中值，称为众数，记为M0。如表2-3 所列的 50枚受精种蛋出雏天数次数分布中，以22出现的次数最多，则该资料的众数为22天。又如【例3.6】所列出的次数分布表中，57—71这一组次数最多，其组中值为64天，则该资料的众数为64天。上一张下一张主页退出

资料中各观测值倒数的算术平均数的倒数，称为调和平均数，记为H，即五、调和平均数资料中各观测值倒数的算术平均数的倒数，称为调和平均数，记为H，即（3—8）调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。上一张下一张主页退出

【例3.8】某保种牛群不同世代牛群保种的规模分别为：0世代200头，1世代220头，2世代210头； 3世代190头，4世代210头，试求其平均规模。利用（3—9）式求平均规模： (头) 即保种群平均规模为208.33头。上一张下一张主页退出

对于同一资料：算术平均数>几何平均数>调和平均数上述五种平均数，最常用的是算术平均数。

第二节标准差一、标准差的意义用平均数作为样本的代表，其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的，还需引入一个表示资料中观测值变异程度大小的统计量。上一张下一张主页退出

全距（极差）是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值，并不能准确表达资料中各观测值的变异程度，比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时，可以利用全距这个统计量。上一张下一张主页退出

为了准确地表示样本内各个观测值的变异程度，人们首先会考虑到以平均数为标准，求出各个观测值与平均数的离差，（），称为离均差。虽然离均差能表示一个观测值偏离平均数的性质和程度，但因为离均差有正、有负，离均差之和为零，即（） = 0 ，因而不能用离均差之和Σ（）来表示资料中所有观测值的总偏离程度。上一张下一张主页退出

为了解决离均差有正、有负，离均差之和为零的问题，可先求离均差的绝对值并将各离均差绝对值之和除以观测值个数 n 求得平均绝对离差，即Σ| |/n。虽然平均绝对离差可以表示资料中各观测值的变异程度，但由于平均绝对离差包含绝对值符号，使用很不方便，在统计学中未被采用。

我们还可以采用将离均差平方的办法来解决离均差有正、有负，离均差之和为零的问题。先将各个离均差平方，即 ( )2 ，再求离均差平方和，即，简称平方和，记为SS；由于离差平方和常随样本大小而改变，为了消除样本大小的影响，用平方和除以样本大小，即，求出离均差平方和的平均数；上一张下一张主页退出

统计量称为均方（ mean square缩写为MS）,又称样本方差，记为S2，即为了使所得的统计量是相应总体参数的无偏估计量，统计学证明，在求离均差平方和的平均数时，分母不用样本含量n，而用自由度 n-1，于是，我们采用统计量表示资料的变异程度。统计量称为均方（ mean square缩写为MS）,又称样本方差，记为S2，即 S2= （3—9）上一张下一张主页退出

相应的总体参数叫总体方差，记为σ2。对于有限总体而言，σ2的计算公式为：（3—10）

由于样本方差带有原观测单位的平方单位，在仅表示一个资料中各观测值的变异程度而不作其它分析时，常需要与平均数配合使用，这时应将平方单位还原，即应求出样本方差的平方根。统计学上把样本方差 S2 的平方根叫做样本标准差，记为S，即：（3-11）上一张下一张主页退出

由于所以（3-11）式可改写为：（3-12）上一张下一张主页退出

在统计学中，常用样本标准差S估计总体标准差σ。相应的总体参数叫总体标准差，记为σ。对于有限总体而言，σ的计算公式为：（3-13）在统计学中，常用样本标准差S估计总体标准差σ。上一张下一张主页退出

二、标准差的计算方法（一）直接法对于未分组或小样本资料，可直接利用（3—11）或（3-12）式来计算标准差。

此例n=10，经计算得：Σx=5400，Σx2=2955000，代入（3—12）式得：【例3.9】计算10只辽宁绒山羊产绒量： 450， 450， 500， 500， 500，550， 550， 550， 600， 600，650（g）的标准差。此例n=10，经计算得：Σx=5400，Σx2=2955000，代入（3—12）式得： (g) 即10只辽宁绒山羊产绒量的标准差为65.828g。上一张下一张主页退出

对于已制成次数分布表的大样本资料，可利用次数分布表，采用加权法计算标准差。计算公式为：（二）加权法对于已制成次数分布表的大样本资料，可利用次数分布表，采用加权法计算标准差。计算公式为：（3—14）式中，f为各组次数；x为各组的组中值；Σf = n为总次数。上一张下一张主页退出

将表3-4中的Σf、Σfx、代入（3—14）式得：【例3.10】利用某纯系蛋鸡200枚蛋重资料的次数分布表（见表3-4）计算标准差。将表3-4中的Σf、Σfx、代入（3—14）式得： (g ) 即某纯系蛋鸡200枚蛋重的标准差为3.5524g。上一张下一张主页退出

表3—4 某纯系蛋鸡200枚蛋重资料次数分布及标准差计算表上一张下一张主页退出

（一）标准差的大小，受资料中每个观测值的影响，如观测值间变异大，求得的标准差也大，反之则小。三、标准差的特性（一）标准差的大小，受资料中每个观测值的影响，如观测值间变异大，求得的标准差也大，反之则小。（二）在计算标准差时，在各观测值加上或减去一个常数，其数值不变。（三）当每个观测值乘以或除以一个常数a，则所得的标准差是原来标准差的a倍或1/a倍。上一张下一张主页退出

（四）在资料服从正态分布的条件下，资料中约有68. 26%的观测值在平均数左右一倍标准差（ ±S）范围内；约有95 （四）在资料服从正态分布的条件下，资料中约有68.26%的观测值在平均数左右一倍标准差（ ±S）范围内；约有95.43%的观测值在平均数左右两倍标准差（ ±2S）范围内；约有99.73%的观测值在平均数左右三倍标准差（ ±3S）范围内。也就是说全距近似地等于6倍标准差，可用（全距/6）来粗略估计标准差。上一张下一张主页退出

第三节变异系数标准差与平均数的比值称为变异系数，记为C·V。第三节变异系数变异系数是衡量资料中各观测值变异程度的另一个统计量。标准差与平均数的比值称为变异系数，记为C·V。变异系数可以消除单位和（或）平均数不同对两个或多个资料变异程度比较的影响。上一张下一张主页退出

变异系数的计算公式为：（3—15）【例3.11】已知某良种猪场长白成年母猪平均体重为 190kg，标准差为10.5kg，而大约克成年母猪平均体重为196kg，标准差为8.5kg，试问两个品种的成年母猪，那一个体重变异程度大。上一张下一张主页退出

所以，长白成年母猪体重的变异程度大于大约克成年母猪。由于，长白成年母猪体重的变异系数：大约克成年母猪体重的变异系数：所以，长白成年母猪体重的变异程度大于大约克成年母猪。上一张下一张主页退出

注意，变异系数的大小，同时受平均数和标准差两个统计量的影响，因而在利用变异系数表示资料的变异程度时，最好将平均数和标准差也列出。上一张下一张主页退出