第二章 计量资料的统计描述.

Slides:



Advertisements
Similar presentations
1 、谁能说说什么是因数? 在整数范围内( 0 除外),如果甲数 能被乙数整除,我们就说甲数是乙数的 倍数,乙数是甲数的因数。 如: 12÷4=3 4 就是 12 的因数 2 、回顾一下,我们认识的自然数可以分 成几类? 3 、其实自然数还有一种新的分类方法, 你知道吗?这就是我们今天这节课的学.
Advertisements

摆一摆,想一想. 棋子个数数的个数 摆出的数 、 10 2 、 11 、 20 3 、 12 、 21 、 30 4 、 13 、 22 、 31 、 40 5 、 14 、 23 、 32 、 41 、

2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
因数与倍数 2 、 5 、 3 的倍数的特 征 新人教版五年级数学下册 执教者:佛山市高明区明城镇明城小学 谭道芬.
人教新课标一年级数学下册. 教学目标 1. 初步掌握 100 以内数的顺序。 2. 初步会比较 100 以内数的大小。 3. 初步结合具体事物,使同学们 感 受 100 以内数的意义,会用 100 以 内的数表示日常生活中的事物, 并进行简单的估计和交流。
医院统计.
医学统计学 主讲人:信息部 林雪君.
体 体 育 育 保 保 健 健 学 学 实 实 验 验 主讲人:王会凤 黄淮学院体育系.
主讲人:赵丽 政治与公共事务管理学院 管理定量分析 主讲人:赵丽 政治与公共事务管理学院
第三章 单变量综合性描述统计量 宇传华.
( Measures of Dispersion )
医学统计学 1 主讲人 陶育纯
第三节 平均指标与标志变异指标 一、集中趋势的代表值 ── 平均指标 常用方法有:算术平均数、调和平均数、中位数和众数等。 (一)算术平均数
一寸光阴一寸金 寸金难买寸光阴 时间.
项目十四 泌乳母猪的饲养管理.
第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.
第十八章 药物疗法与过敏试验法 郭三花 岳月梅 忻州职院护理系.
第三章 集中量数.
应用统计第1章 以Excel 和SPSS为工具的管理统计 同济大学经济与管理学院 管理科学与工程系 张建同 教授.
4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
第三章 平均数、标准差 与变异系数 3.1 平均数: 在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有: 1. 算术平均数 2. 中位数(M) 4. 几何平均数(Mg) 3. 众数(Mo) 5. 调和平均数(H)
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
第二章 统计资料的整理与分析 上一张 下一张 主 页 退 出.
第一章.
第 2章 统计数据的描述 2.1 数据的计量尺度 2.2 统计数据的来源 2.3 统计数据的质量 2.4 统计数据的整理
基本概念 资料类型 计量资料:用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得数据为数值变量。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
统计学期末复习
体育选项课件 健美操理论课 任课教师:黄明礼 湄洲湾职业技术学院.
复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第十四章 数值变量的统计描述.
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
第十章 方差分析.
網路遊戲版 幸福農場168號.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Descriptive Statistics
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
统计图表绘制 电子工业出版社.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
用样本估计总体.
13.2 物质波 不确定关系 微观粒子的波粒二象 + ? 德布罗意假设(1924年): 实物粒子具有波粒二象性。 波长 频率
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Presentation transcript:

第二章 计量资料的统计描述

计量资料的分类: 1.离散型资料(discrete data):是指变量取值可以一一列举的资料。例如,每个育龄妇女现有的子女数。 2.连续型资料(continuity data):是指变量取值不能一一列举(即变量取值为一定范围内的任意值)的资料。例如,人体的身高(cm)、体重(kg) 等。

第一节 频数分布表和频数分布图 频数表适用于: 观察例数较多的计量资料。 一、频数分布表: 频数(frequency):不同组别内的观察 值个数称为频数,表示观察值在各组内出 现的频繁程度。 频数表:将分组标志和相应的频数列表, 即为频数分布表,简称频数表。

(一)离散型计量资料的频数表见P7 (二)连续型计量资料的频数表 频数表编制: 1.求全距(极差): R = MAX - MIN 2.定组距和组段,一般8~15组为宜 组距=[R/10] 组段=R÷组距 组中值=(本组段下限+下组段下限)÷2

3.列表划记 第一组段应包括MIN 最末组段应包括MAX且同时写出下限和上限 每一组段数值范围:下限≤X<上限 下限(lower limit):每个组段的起点称为该组的下限。 上限(upper limit):每个组段的终点称 为该组的上限。 3.列表划记

频数分布表的用途 (1)是大样本数据常用的表达方式。 (2)便于观察数据的分布类型(以便选择相应的统计指标和分析方法)。 对称分布:集中位置在中间。左右两侧频数基本对称。 偏态分布 正偏态分布:集中位置偏向数值较小的一侧。 负偏态分布:集中位置偏向数 值较大的一侧。

(3)便于发现资料中的可疑值 (4)当 n足够大时,以f P的估计值,便于进一步计算统计指标和进行统计分析。 二、频数分布图 直方图:适合描述连续型资料的频数分布。

第二节 计量资料集中趋势的描述 平均数(average):是一类描述计量资料集中位置或平均水平的统计指标。 常用的平均数——算术平均数、几何均数、中位数

一、算术均数 算术均数简称均数(mean),描述一组同质资料的平均水平。 总体均数: 样本均数: (一)计算方法 1.直接法:适用于样本量较小的计量资料。

2.加权法:适用于样本量较大的计量资料。 (二)均数的特性 1.各观察值与均数之差(离均差)的总和等于零,即

2.各观察值的离均差平方和最小,即 (三)均数的应用 1.均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。 2.均数适用于描述单峰对称分布,特别 是正态或近似正态分布资料的集中趋势。

二、几何均数(geometric mean) (一)计算方法 1.直接法:适用于样本量较小的计量资 料。 或

2.加权法:适用于样本量较大的计量资料,如频数表资料。

(二)几何均数的应用注意事项 1.几何均数常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。 2.观察值中若有0或负值,则不宜直接使用几何均数。 3.观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。

三、中位数(median) 中位数是将一组观察值按大小顺序排列后, 位次居中的观察值。 (一)计算方法 1.直接法:适用于样本量较小的计量资料。 当 为奇数时 当 为偶数时

2.频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。

(二)中位数的应用注意事项 1.中位数可用于各种分布的资料。 2.中位数不受极端值的影响,因此,实际工作中主要用于: (1)偏态分布资料 (2)端点无确切值的资料 (3)分布不明确的资料

百分位数 1.定义:百分位数(percentile)是指将观察值从小到大排列后处于第x百分位置上的数值。用符号表示为 ,它是个位置指标。 2.计算方法:

PX X% (100-X)%

29.81% 80 100 120 64.40%

第三节 计量资料离散趋势 的描述

衡量变异程度(或离散程度)的指标 分类: (按间距)—极差(R)和四分位数间距(Q) (按平均差距)—离均差平方和(SS)、方差(S2) 、标准差(S)和变异系数(CV)

一、极差和四分位数间距 (一)极差(全距)(range) 公式:R=MAX-MIN 性质:R大(小) 变异度大(小)

应用:适用于任何分布的计量资料 (端点无确切值者除外) 优点:简单明了,应用广泛,如用于说明传染病 、食物中毒等的最短、最长潜伏期等。

缺点: a.除MAX和MIN外,不能反映组内其它数据 变异度 。 b. 极差抽样误差大,受两个极端值影响, 不够稳定,通常只用于资料的粗略分析和小样本数据。

例1:甲:1 4 4 4 7 乙:4 4 4 4 4 R=6 R=0 X=M=4

例2: A 26℃ A 2℃ B B 50℃ X=26℃

例3:甲:2 4 6 8 10 乙:2 5 6 7 10 R=8 X=M=6

(二)四分位数间距(quartile,简记为Q 公式: 性质: Q 越大,说明数据的变异越大; 反之,Q 越小,说明变异越小。 应用:适用于任何分布的计量资料,计 算结果较稳定,尤其适用于大样本偏态 分布资料。 Q=P75-P25

特点:比极差稳定,但仍未考虑到每个观察值的 变 异度,在统计分析中应用得不普遍。

0 P25 P50 P75 100%

百分位数 1.定义:百分位数(percentile)是指将观 察值从小到大排列后处于第x百分位置上的 数值。用符号表示为 ,它是个位置指标。 2.计算方法:

二、离均差平方和、方差、标准差 (一)平均偏差(mean difference, 简记为M.D) 公式: 平均偏差=

应用: 平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大的限制,实际中很少使用。

(二)离均差平方和(SS) 公式:SS=

(三)方差(variance) ,方差有时也表示为 MS 方差计算公式: (1)总体方差: = (2)样本方差:

方差性质:方差越大说明数据的变异越大 自由度(degree of freedom,简记为DF) (1)定义:随机变量能自由取值的个数 (2)计算公式:υ=n-限制条件个数

例:有一四个(n=4)数据样本,受到 的条件限制,在自由确定4,2,5三个数据 后,第四个数只能是9, 因而 υ=n-1=3 。