第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.

Slides:



Advertisements
Similar presentations
简单迭代法的概念与结论 简单迭代法又称逐次迭代法,基本思想是构造不动点 方程,以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式, 返回下一页 则称迭代格式 收敛, 否则称为发散 上一页.
Advertisements

浦江二中 钱咏梅. 垂体 甲状腺 胸腺 肾上腺 胰岛 卵巢(女性) 睾丸(男性) 人体主要的内分泌腺 性腺性腺 }
护理病历 题目:Ⅱ型糖尿病患者的护理 实习护士 梁佩霞 病历指导教师 石姝梅老师 专业负责人 胡宪法老师 实习医院 顺德区第一人民医院.
统计与可能性总复习 第六单元 统计与可能性 一 、 1 )抛一枚硬币,有( )可能, 分别是( )和( )。出 现正面的可能性是( )。 2 ) 某人抛硬币连续 5 次都正面朝上, 那么第 6 次抛硬币正面朝上的可能性 ( ),如果抛 60 次,正面朝上 可能是( )次,反面朝上是( ) 次。 两种.
50912 吳明杰 獅子. 公獅經常在晨曦和傍晚時分吼叫,主要是宣示主 權。獅子是貓科動物中唯一的群居品種,獅群捕 獵:獅子狩獵時會集體行動,牠們常用的方式是 幾頭獅子先在有利的地方埋伏,另一頭獅子則公 然追趕獵物,目的是把獵物驅趕往埋伏好的獅子 附近。獅子喜歡在晚間狩獵,這樣可以提高成功 率。 公獅.
嬰幼兒的發展與保育. 嬰幼兒外觀的發展 一、身高體重 1. 出生 6 個月內的嬰兒每個月增加 0.5-1kg 2. 1 歲時約 10kg 3. 1 歲比出生時的身高約多了 50% , 4 歲時達出生時身長的 2 倍 4. 一般而言, 食用母奶的嬰兒較配方奶的嬰兒發展 較為緩慢 5. 身高體重低於 25%
( 1 )用秤可以称出物体的( )。 ( 2 )表示物体有多重,可以用( )和 ( )作单位,物体较轻时用( ),物体 较重时用( )。 “ 克 ” 用 “g” 表示; “ 千克 ” 用 “kg” 表示. 质量 克 千克 克 ( 3 ) 1 千克 = ( )克 5000 克 = ( )千克 1 千克.
窦娥冤 关汉卿 感天动地 元·关汉卿.
专利技术交底书的撰写方法 ——公司知识产权讲座
第五章 话语的语用意义(上) 主讲人:周明强.
大南海文化園區 (國立歷史博物館 -初期計畫) 簡介
大洋洲.
我的家乡 南通 ….
中国医科大学法医学院血清学教研室 刘利民 教授
当代 国 际 关 系(案例6) 冷战时期美苏关系的演变.
青春花季 拒绝香烟 12机电大专(1)班 主题班会.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
2000年7月5日 星期三 口语 复习课 教务处公开示范课 制作、授课:郑艳群.
資料的描述: 在研讀完本章之後,您應當能夠進行下列事項: CHAPTER 3 目標 位置和離差的測量
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
知其不可而为之.
第三章 生产活动与地域联系 第二节 工业区位.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
主办:泰兴市质量强市领导小组办公室 承办:泰 兴 市 市 场 监 督 管 理 局.
通榆县养殖技术培训班 中国肉牛选育及杂种优势利用 张国梁 国家肉牛牦牛产业技术体系 2015年8月27日.
田径运动.
第一讲 食用菌的营养价值和药用价值.
汉字的构造.
诵读欣赏 古代诗词三首.
巫山职教中心欢迎您 1.
战 后 国 际 关 系 专题五:冷战时期美苏关系的演变 政治学与行政管理系.
第十一章 理气剂.
四种命题 班级:C274 指导教师:钟志勤 任课教师:颜小娟.
第三节 固精缩尿止带药 1.特点:酸涩收敛,主归肾、膀胱经。 2.功效:固精、缩尿、止带。兼补肾。
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
第一章.
第十九章 货币均衡 一、本章主要内容与结构安排 货币供求均衡与社会总供求平衡 货币均衡 通货膨胀 通货紧缩.
五、学习方法及应考对策 (一)学习方法 1.保证复习时间,吃透教材:上课之前应该对课程相关内容进行预习,把不理解的问题记录下来,带着问题听课。考试之前务必把课本看3遍以上,第一遍一定要精读,最好能做笔记,边读边记,不要快,要记牢。第二、三遍可以查缺补漏型的看,通过做题目看书,加深课本印象。 2.加强概念、理论性内容的重复记忆:概念、理论性内容一般比较抽象,所以在理解的基础上一定要重复记忆,在接受辅导之后,再加以重点记忆,以便及时巩固所学内容,切忌走马观花似的复习,既浪费时间,效果也不好。
欢迎各位领导莅临指导 超重和失重 主讲人: 李东红.
7-1 能量的形式和轉換 1 of 12 能量是促成自然現象變化的根源,太陽能替我們將水搬到高處,人類再利用高、低水位差發電。
口腔需求品類 -以家樂福為例 指導老師:莊勝雄 老師 組員:497D0033 邱郁閔 497D0086 陳育嘉 497D0092 黃靜宜
《生活与哲学》第一轮复习 第七课唯物辩证法的联系观.
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
湖南农业大学农业航空团队研究成果 航空作业机型 湖南农业大学农业航空研究中心 成果专栏 ◎团队简介
“食品公司”.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
第十四章 数值变量的统计描述.
第三章 統計資料之分析解釋(一).
本章重點: 一、集中量數的意義和種類 二、算術平均數 三、中位數(中數) 四、眾 數 五、其他集中量數 六、SPSS12.0實務操作
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
貨幣需求與貨幣市場的均衡.
导数的应用 ——函数的单调性与极值.
棠外附小三年级数学下册 口算大王比赛 请你在10秒钟内做好准备!.
萬有引力 =一種令兩個或以上物體互相吸引的力量。 →地心吸力,令人們有「重量」感 →星體引力,令星體之間維持平衡,保持一定距離
第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析.
商業行為成立的要件 動動腦 Q 請試著判斷下列何者為商業行為? 請試著判斷下列何者為商業行為?.
第四章 集中趋势测量法 算术平均数 主 要 内 容 中位数 众数 几何平均数和调和平均数.
总体特征数的估计.
職災案例 指導教師:楊慶章 學 生:許承霖、吳鎮廷、孔張孔 大仁科技大學環境與職業安全衛生系
线性代数电子课件 西安石油大学理学院 工程数学教研室制作.
第一单元 四则运算 乘、除法的定义及各部分间的关系 北京市东城区府学胡同小学 吴建成.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
家禽生产与疾病防治 任务一 肉鸡品种的选择 家禽生产与疾病防治 课程组 2019年5月24日1时52分.
危险化学品事故调查实例系列讲座③ 鞭炮厂大爆炸 侦破记 赵铸新 主讲
生物统计学 Biostatistics 第一章 统计数据的收集与整理
多姿多彩的世界.
106年免試入學第一次模擬 選填重要日程表說明 1.106年1月10日中午12時~106年1月16日中午12時完成第一次模擬
习惯跑步 徐凤林 北京大学哲学系 2019年5月29日.
Presentation transcript:

第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出

平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有: 算术平均数(arithmetic mean) 中位数(median) 众数(mode) 几何平均数(geometric mean) 调和平均数(harmonic mean) 上一张 下一张 主 页 退 出

算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为。 一、算术平均数 算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为。 算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法 主要用于样本含量n≤30以下、未经分组资料平均数的计算。 上一张 下一张 主 页 退 出

设某一资料包含n个观测值: x1、x2、…、xn, 则样本平均数可通过下式计算: (3-1) 其中,Σ为总和符号; 表示从第一个观测值x1累加到第n个观测值xn。当 在意义上已明确时,可简写为Σx,(3-1)式可改写为: 上一张 下一张 主 页 退 出

【例3.1】 某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数。 由于 Σx=500+520+535+560+58 +600+480+510+505+49 =5285, n=10 上一张 下一张 主 页 退 出

对于样本含量 n≥30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为: 得: 即10头种公牛平均体重为528.5 kg。 (二)加权法 对于样本含量 n≥30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为: (3-2) 上一张 下一张 主 页 退 出

第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量,因此将fi 称为是xi的“权”,加权法也由此而得名。 —分组数 第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量,因此将fi 称为是xi的“权”,加权法也由此而得名。 【例3.2】 将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其加权数平均数。 上一张 下一张 主 页 退 出

表3—1 100头长白母猪仔猪一月窝重次数分布表 上一张 下一张 主 页 退 出

即这100头长白母猪仔猪一月龄平均窝重为45.2kg。 利用(3—2)式得: 即这100头长白母猪仔猪一月龄平均窝重为45.2kg。 计算若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。 上一张 下一张 主 页 退 出

此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即 【例3.3】 某牛群有黑白花奶牛 1500头,其平均体重为750 kg ,而另一牛群有黑白花奶牛1200头,平均体重为725 kg,如果将这两个牛群混合在一起,其混合后平均体重为多少? 此例两个牛群所包含的牛的头数不等,要计算两个牛群混合后的平均体重,应以两个牛群牛的头数为权,求两个牛群平均体重的加权平均数,即 上一张 下一张 主 页 退 出

1、样本各观测值与平均数之差的和为零,即离均差之和等于零。 即两个牛群混合后平均体重为738.89 kg。 (三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零。 或简写成 上一张 下一张 主 页 退 出

2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 (xi- )2 < (xi- a)2 (常数a≠ ) 或简写为: < 对于总体而言,通常用μ表示总体平均数,有限总体的平均数为: (3-3) 上一张 下一张 主 页 退 出

当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。 式中,N表示总体所包含的个体数。 当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。 统计学中常用样本平均数( )作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。 上一张 下一张 主 页 退 出

将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。 二、中位数 将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。 当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。 中位数的计算方法因资料是否分组而有所不同。 上一张 下一张 主 页 退 出

对于未分组资料,先将各观测值由小到大依次排列。 (一)未分组资料中位数的计算方法 对于未分组资料,先将各观测值由小到大依次排列。 上一张 下一张 主 页 退 出

1、当观测值个数n为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数: Md= 2、当观测值个数为 偶 数 时 , n/2和(n/2+1)位置的两个观测值之和的1/2为中位数,即: (3-4) 上一张 下一张 主 页 退 出

【例3.4】 观察得9只西农莎能奶山羊的妊娠天数为 144 、 145、 147、 149、150、151、153、156、157,求其中位数。 此例 n=9,为奇数,则: Md= =150(天) 即西农莎能奶山羊妊娠天数的中位数为150天。 上一张 下一张 主 页 退 出

【例3.5】 某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。 【例3.5】 某犬场发生犬瘟热,观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天,求其中位数。 此例n=10,为偶数,则: (天) 即10只仔犬从发现症状到死亡天数的中位数为11.5天。 (二)已分组资料中位数的计算方法 上一张 下一张 主 页 退 出

若资料已分组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为: (3—5) 式中:L — 中位数所在组的下限; i — 组距; f — 中位数所在组的次数; n — 总次数; c — 小于中数所在组的累加次数。 上一张 下一张 主 页 退 出

【例3.6】 某奶牛场68头健康母牛从分娩到第一次发情间隔时间 整理成次数分布表如表 3—2 所示,求中位数。 【例3.6】 某奶牛场68头健康母牛从分娩到第一次发情间隔时间 整理成次数分布表如表 3—2 所示,求中位数。 表3—2 68头母牛从分娩到第一次发情间隔时间 次数分布表 上一张 下一张 主 页 退 出

即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。 由表3—2可见:i=15,n=68,因而中位数只能在累加头数为36所对应的“57—71”这一组,于是可确定L=57,f=20,c=16,代入公式(3—5)得: (天) 即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。 上一张 下一张 主 页 退 出

三、几何平均数 n 个观测值相乘之积开 n 次方所得的方根,称为几何平均数,记为G。它主要应用于畜牧业、水产业的生产动态分析,畜禽疾病及药物效价的统计分析 。 如畜禽 、水产养殖的 增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等,用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下: (3-6) 上一张 下一张 主 页 退 出

为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即 (3-7) 【例3.7】 某波尔山羊群1997—2000年各年度的存栏数见表3—3,试求其年平均增长率。 上一张 下一张 主 页 退 出

表3—3 某波尔山羊群各年度存栏数与增长率 上一张 下一张 主 页 退 出

利用(3—7)式求年平均增长率 G= =lg-1[(-0.368-0.398–0.602)] =lg-1(-0.456)=0.3501 即年平均增长率为0.3501或35.01%。 上一张 下一张 主 页 退 出

资料 中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M0。 四、众 数 资料 中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M0。 如表2-3 所列 的 50枚受精种蛋出雏天数次数分布中,以22出现的次数最多,则该资料的众数为22天。 又如 【例3.6】 所 列 出 的 次数分布表中,57—71这一组次数最多,其组中值为64天,则该资料的众数为64天。 上一张 下一张 主 页 退 出

资料中各观测值倒数的 算术平均数 的倒数,称为调和平均数,记为H,即 五、调和平均数 资料中各观测值倒数的 算术平均数 的倒数,称为调和平均数,记为H,即 (3—8) 调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。 上一张 下一张 主 页 退 出

【例3.8】 某保种牛群不同世代牛群保种的规模分别为:0世代200头,1世代220头,2世代210头; 3世代190头,4世代210头,试求其平均规模。 利用(3—9)式求平均规模: (头) 即保种群平均规模为208.33头。 上一张 下一张 主 页 退 出

对于同一资料: 算术平均数>几何平均数>调和平均数 上述五种平均数,最常用的是算术平均数。

第二节 标准差 一、标准差的意义 用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。 上一张 下一张 主 页 退 出

全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。 上一张 下一张 主 页 退 出

为 了 准 确 地 表示样本内各个观测值的变异程度 ,人们 首 先会考虑到以平均数为标准,求出各个观测值与平均数的离差,( ) ,称为离均差。 虽然离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负 ,离均差之和 为零,即( ) = 0 ,因 而 不 能 用离均差之和Σ( )来 表 示 资料中所有观测值的总偏离程度。 上一张 下一张 主 页 退 出

为了解决离均差有正 、有负,离均差之和为零的问 题 , 可先求 离 均 差的绝 对 值 并 将 各 离 均 差 绝对 值 之 和 除以 观 测 值 个 数 n 求 得 平 均 绝 对 离差,即Σ| |/n。虽然平均绝对离差可以表示资料中各观测值的变异程度 ,但由于平均绝对离差包含绝对值符号 ,使用很不方便,在统计学中未被采用。

我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。 先将各 个离 均差平方,即 ( )2 ,再求 离均差平方和 , 即 ,简称平方和,记为SS; 由 于 离差平方和 常 随 样 本 大 小 而 改 变 ,为 了 消 除 样 本大小 的 影 响 , 用平方和 除 以 样 本 大 小, 即 ,求出离均差平方和的平均数 ; 上一张 下一张 主 页 退 出

统计量 称 为 均 方 ( mean square缩写为MS),又称样本方差,记为S2,即 为了使所得的统计量是相应总体参数的无 偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度 n-1, 于是,我们 采 用统计量 表示资料的变异程度。 统计量 称 为 均 方 ( mean square缩写为MS),又称样本方差,记为S2,即 S2= (3—9) 上一张 下一张 主 页 退 出

相应的总体参数叫 总体方差 ,记为σ2。对于有限总体而言,σ2的计算公式为: (3—10)

由于 样本方差 带有原观测单位的 平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时 , 常需要与平均数配合使用 ,这 时应 将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差 S2 的平方根叫做样本标准 差,记为S,即: (3-11) 上一张 下一张 主 页 退 出

由于 所以(3-11)式可改写为: (3-12) 上一张 下一张 主 页 退 出

在统计学中,常用样本标准差S估计总体标准差σ。 相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为: (3-13) 在统计学中,常用样本标准差S估计总体标准差σ。 上一张 下一张 主 页 退 出

二、标准差的计算方法 (一)直接法 对于未分组或小样本资料 , 可直接利用(3—11)或(3-12)式来计算标准差。

此例n=10,经计算得:Σx=5400,Σx2=2955000,代入(3—12)式得: 【例3.9】 计算10只辽宁绒山羊产绒量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的标准差。 此例n=10,经计算得:Σx=5400,Σx2=2955000,代入(3—12)式得: (g) 即10只辽宁绒山羊产绒量的 标准差 为65.828g。 上一张 下一张 主 页 退 出

对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为: (二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为: (3—14) 式中,f为各组次数;x为各组的组中值;Σf = n为总次数。 上一张 下一张 主 页 退 出

将表3-4中的Σf、Σfx、 代入(3—14)式得: 【例3.10】 利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差。 将表3-4中的Σf、Σfx、 代入(3—14)式得: (g ) 即某 纯 系 蛋 鸡200枚 蛋 重的标准差为3.5524g。 上一张 下一张 主 页 退 出

表3—4 某纯系蛋鸡200枚蛋重资料次数分布 及标准差计算表 上一张 下一张 主 页 退 出

(一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。 三、标准差的特性 (一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。 (二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。 (三)当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。 上一张 下一张 主 页 退 出

(四)在资料服从正态分布的条件下,资料中约有68. 26%的观测值在平均数左右一倍标准差( ±S)范围内;约有95 (四)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差( ±S)范围内;约有95.43%的观测值在平均数左右两倍标准差( ±2S)范围内;约有99.73%的观测值在平均数左右三倍标准差( ±3S) 范 围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差。 上一张 下一张 主 页 退 出

第三节 变异系数 标 准差与平均数的比值称为 变异系数,记为C·V。 第三节 变异系数 变异系数是衡量资料中各观测值变异 程度的另一个统计量 。 标 准差与平均数的比值称为 变异系数,记为C·V。 变异系数可以消除单位 和 (或)平 均数不同对两个或多个资料变异程度比较的影响。 上一张 下一张 主 页 退 出

变异系数的计算公式为: (3—15) 【例3.11】 已知某良种猪场长白成年母猪平均体重为 190kg, 标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。 上一张 下一张 主 页 退 出

所以,长白成年母猪体重的变异程度大于大约克成年母猪。 由于,长白成年母猪体重的变异系数: 大约克成年母猪体重的变异系数: 所以,长白成年母猪体重的变异程度大于大约克成年母猪。 上一张 下一张 主 页 退 出

注意,变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。 上一张 下一张 主 页 退 出