第十章 统计表与统计图 Statistical Table &Statistical Graph.

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
3.4 空间直线的方程.
第六章 统计表与统计图 第一节 统计表 第二节 统计图 1.
龙星课程—肿瘤生物信息学上机课程 曹莎
第二章 二次函数 第二节 结识抛物线
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
折线统计图 张家产中心完小.
PRESENTED BY OfficePLUS
走势分析.
扇 形 统 计 图 吴兴区太湖小学 黄晓燕.
医学统计学 主讲人:信息部 林雪君.
第六章 调查数据的整理 第一节 数据的预处理 第二节 统计分组和次数分布 第二节 统计表和统计图.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
不确定度的传递与合成 间接测量结果不确定度的评估
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
初中数学 九年级(下册) 5.3 用待定系数法确定二次函数表达式.
第一节 儿科学的范围和任务.
拓展 问题 探究 练习 北师大版 五年级上册 第五单元 分数的意义 绿色圃中小学教育网
复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
 做一做   阅读思考 .
数学模型实验课(三) 插值与三维图形.
第十章 方差分析.
1085至1125年间的官员地域分布与社会关系 1.
整合思维导图的初中英语教学设计 主讲人:卢璐.
第四节 统计表与统计图 统计表(statistical table)——数据代替文字描述,便于统计结果的精确、简洁的表达和对比分析
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
线段的有关计算.
相似三角形 石家庄市第十中学 刘静会 电话:
模型分类问题 Presented by 刘婷婷 苏琬琳.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
项目二:HTML语言基础.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
6.4 你有信心吗?.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
小数的大小比较 仙岩镇第二小学 陈曼丽.
统计图表绘制 电子工业出版社.
可编辑图表汇总 修改方法: 点击图表内容→“设计”选项卡→编辑数据.
函 数 连 续 的 概 念 淮南职业技术学院.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
一元二次不等式解法(1).
小数的加法和减法 小数加、减计算 (例2).
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
用样本估计总体.
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
24.4弧长和扇形面积 圆锥的侧面积和全面积.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
三角 三角 三角 函数 余弦函数的图象和性质.
位似.
Statistical Table and Statistical Graph
一元一次方程的解法(-).
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

第十章 统计表与统计图 Statistical Table &Statistical Graph

 统计表 (statistical table) 是表达统 计分析结果中数据和统计指标的 表格形式;  统计图 (statistical graph) 是用点、 线、面等各种几何图形来形象化 表达统计数据。

第一节 统计表 一、统计表的意义与制作原则 1 .统计表的意义 统计表用简明的表格形式,有条理地罗列数据 和统计量,方便阅读、比较和计算。 2 .制表原则:重点突出、层次清楚 3 .制表的基本要求

(1) 标题:概括表的主要内容,包括研究的 时间、地点和研究内容,放在表的上方。 (2) 标目:分别用横标目和纵标目说明表格 每行和每列数字的意义,注意标明指标的 单位。

(3) 线条:至少用三条线,表格的顶线和 底线将表格与文章的其它部分分隔开 来,纵标目下横线将标目的文字区与 表格的数字区分隔开来。部分表格可 再用横线将合计分隔开,或用横线将 两重纵标目分割开。其它竖线和斜线 一概省去。

(4) 数字:用阿拉伯数字表示。无数字用 “—” 表示,缺失数字用 “  ” 表示,数值 为 0 者记为 “0” ,不要留空项。数字按小 数位对齐。 (5) 备注:表中数字区不要插入文字,也 不列备注项。必须说明者标 “*” 号,在 表下方说明。

二、统计表的种类

例 10-1 表 10-1 列出某地进行喷昔 洛韦软膏治疗颜面单纯疱疹与阿昔 洛韦软膏比较的随机对照临床试验 结果。该表只有试验分组一个层次, 属简单表。 1. 简单表 统计表的主语只有一个层次

表 10-1 某年某地喷昔洛韦软膏治疗颜面单纯疱疹疗效比较 如何完成喷昔洛韦软膏治疗颜面单纯疱疹疗效的比较分析?

2. 组合表 统计表的主语有两个 以上层次 例 10-2 某年某地分别在城乡进 行乙型肝炎病毒抗原携带者的检测, 该研究的对象按城乡和年龄两个特 征分层,结果列在表 10-2 。该表属 组合表。

表 10-2 某年某地城乡各年龄组居民乙型肝炎病毒抗原携带率分析 请分别指出城乡 25 ~组的发生率和构成比。

三、编制统计表的注意事项 例 10-3 某地进行冠心病危险因 素研究时,调查了居民的心理得分 值与其它冠心病有关因素,结果列 成表 10-3 。

表 10-3 不同心理分值的冠心病危险因素水平比较

问 题  将太多的内容放在一个表里,特别是将两种 不同类型资料(计量资料和计数资料)的统 计量放在同一表中。  互不相容的内容分别占了不同的列,导致表 中有许多空格。  纵横标目倒置。  内容较多,层次复杂,表格中数据罗列无条 理,较难读懂。

表 10-4 某年某地居民不同心理分值的冠心病危险因素水平比较 (X±S) 处理办法: 将该表资料分别制成两 个统计表,见表 10-4 和表 10-5 。

表 10-5 某年某地居民不同心理分值的冠心病危险因素水平比较

第二节 统计图 1 .统计图的意义 : 统计图将统计数据 形象化,让读者更易于领会统计资料 的核心内容,易于做分析比较,并且 可以给读者留下深刻的印象。

2 .统计图的种类:根据资料类型和统计分 析目的不同,需要用不同的统计图表达数 据和统计指标值。常用的统计图有直条图、 直方图、百分比条图和圆图、线图、散点 图和统计地图等,还有在数据探索性分析 中应用的茎叶图、残差图、箱式图,序贯 分析的检验区域图,判别分析的类别分布 图,聚类分析的谱系图等特殊分析图等。

3 .统计图制作的一般原则 (1) 根据资料性质和分析目的正确选用 适当的统计图。 (2) 必须有标题,概括统计图资料的时 间、地点和主要内容。统计图的标 题一般 放在图的下方。

(3) 统计图一般有横轴和纵轴,并分别用 横标目和纵标目说明横轴和纵轴代表的 指标和单位。一般将两轴的相交点即原 点处定为 0 。纵横轴的比例一般以 5 : 7 或 7 : 5 为宜。 (4) 统计图用不同线条和颜色表达不同事 物和对象的统计量,需要附图例加以说 明。图例可放在图的右上角空隙处或下 方中间位置。

二、常用统计图 1 .直条图 (bar chart) 2 .圆图 (pie chart) 和百分比条图 (percent bar chart) 3 .线图 (line graph) 4 .直方图 (histogram) 5 .统计地图 (statistical map) 6 .其他特殊分析图 箱式图 (box plot) 茎叶图 (stem-leaf plot) 误差条图 (error bar chart)

1 .直条图 (bar chart) 用相同宽度的直条长短表示相互 独立的某统计指标值的大小。直条 图按直条是横放还是竖放分卧式和 立式两种,按对象的分组是单层次 和两层次分单式和复式两种。

例 10-4 图 10-1 显示某地某年主 要死因死亡率资料,不同死因是相 互独立的不连续指标,因此用直条 图。该图只按死因分类,为单式立 式直条图。

图 10-1 某年某地主要死因的死亡率 (/10 万 )

直条图的纵轴尺度起点必须为零示意图

2 .圆图和百分比条图  圆图 (pie chart) 是以圆形总面积作为 100% ,将 其分割成若干个扇面表示事物内部各构成部 分所占的比例。  百分比条图 (percent bar chart) 是以矩形总长度 作为 100% ,将其分割成不同长度的段表示各 构成的比例。  圆图和百分比条图适合描述分类变量的构成 比资料。

例 10-5 某年某地进行婴儿死亡原因 的调查,根据城市婴儿死因的构成资 料绘制成图 10-2 。 从图 10-2 可见出生窒息是婴儿死亡 的首位死因,出生窒息、早产和肺炎 头三位死因占总死亡的 60.3% ,是婴儿 死亡防治的重点。

图 10-2 某年某地城市婴儿死因构成比

例 10-6 图 10-3 是根据某地 20 世纪 70 年代和 80 年代恶性肿瘤发病登记资料绘制成的百分比 条图。由图可见不同年代主要恶性肿瘤中,鼻 咽癌和肝癌构成减少,肺癌明显增加。 百分比条图特别适合作多个构成比的比 较,将不同组别,不同时间或不同地区的某 分类指标的构成比平行地绘制成多个百分比 条图,可以方便地比较其构成比的差异。

图 世纪 70 年代和 80 年代某地 7 常见恶性肿瘤发病构成比较

3 .线图 (line graph) 线图是用线段的升降来表示数值的变化,适合于 描述某统计量随另一连续性数值变量变化而变化的趋 势,最常用于描述统计量随时间变化而变化的趋势。 普通线图:横轴和纵轴都是算术尺度。 半对数线图:横轴是算术尺度,纵轴是对数尺度, 特别适宜作不同指标变化速度的比较。

例 10-7 图 10-4 是根据 1990~2000 年某沿海 城市甲状腺功能亢进(甲亢)发病率资料绘 制的普通线图。 图 10-4 可看出在 1995 年开始食盐加碘后, 甲亢发病率有一突增高峰, 1999 年以后又逐 渐下降的趋势。

图 ~2000 年某沿海城市甲状腺功能亢进发病率变化趋势

例 10-8 调查某地 1997 年 ~2001 年两种与 性传播有关疾病 — 艾滋病和梅毒的发病率变 化趋势,资料分别绘制成普通线图和半对数 线图。 普通线图显示梅毒的增长幅度较大,但 半对数线图则显示艾滋病的增长速度更快。

图 ~2001 年某地艾滋病和梅毒发病率的变化趋势 (a) 纵轴为算术尺度 ; (b) 纵轴为对数尺度。

注意:  普通线图的纵轴一般以 0 点作起点,否则需 作特殊标记或说明,以防给读者错误印象。  标记直线的连接点时要注意,如测定值是在 某时间段或数值段的,应标记在段的中点 ; 如测定值是在某时点或确定值的,标记在相 应时点或数值上。

4 .直方图 (histogram) 以直方面积描述各组频数的多少,面积的总和相当于 各组频数之和,适合表示数值变量的频数分布。直方图 的横轴尺度是数值变量值,纵轴是频数。注意如各组的 组距不等时,要折合成等距后再绘图,即将频数除以组 距得到单位组距的频数作为直方的高度,组距为直方的 宽度。另一种表示数值变量资料频数分布的方式是将各 组段观察频数除以总观察频数得到各组段的频率,以各 组段频率除以组距得到的频率密度作为直方图高度,绘 制的直方图称为频率直方图,它以各直方面积表示各组 频率,其面积的总和为 1 。

例 年某地共报告乙型病毒 性脑炎 104 例,其年龄分布如表 10-6 。

图 年某地乙型病毒性脑膜炎病例的年龄分布

5 .统计地图 (statistical map) 统计地图是用不同的颜色和花纹表示统 计量的值在地理分布上的变化,适宜描述研 究指标的地理分布。 例 年广东省发生了某急性传染病的 流行,图 10-7 描述了该急性传染病发病数在广 东省的分布情况。

图 年广东省某急性传染病发病数的地理分布 图例中括号内是发生相同病例数的行政区频数,其余指数据缺失的行政区

6 .其他特殊分析图 在探索性数据分析中,一些特殊 的统计图对于发现数据分布特征 有着重要的意义。这里介绍常用 的箱式图、茎叶图和误差条图。

箱式图 (box plot) 使用 5 个统计量反映原始数据的分布特征, 即数据分布中心位置、分布、偏度、变异范围 和异常值。 箱式图的箱子两端分别是上四分位数和下 四分位数,中间横线是中位数,两端连线分别 是除异常值外的最小值和最大值。另外标记可 能的异常值。 显然箱子越长,数据变异程度越大。中间 横线在箱子中点表明分布对称,否则不对称。

例 某地调查不同类型化妆品厂 车间内粉尘数,结果绘制成图 10-8 。 图中显示粉尘数的分布呈偏态分布, 净化厂粉尘数较少,非净化厂粉尘数较多 。

图 10-8 某地不同类型化妆品厂车间粉尘数分布箱式图

茎叶图 (stem-leaf plot) 将数据分离成两部分:整数部分和尾数部 分,整数部分形成图的茎,尾数部分形成图 的叶。茎叶图的排列方式与频数表有些相似, 每行由一个整数的茎和若干叶构成。左边是 茎的数值,茎宽一般标在图的下方。右边是 叶,图显示每个叶的尾数数值,同样在图的 下方标示每个叶代表几个实际观察值。茎叶 图可以非常直观地显示数据的分布范围和形 态,近年非常流行。

例 利用第二章例 2-1 的数据绘制茎叶 图,结果为图 10-9 。图中茎的宽度为 1 ,即 观察值的整数位。每个叶代表 1 个观察值, 显示的尾数即观察值的第一位小数。从图可 以看出血清总胆固醇的分布范围从 2.3 到 5.7 , 基本近似正态分布。而且可以查看每个观察 值的取值情况。

误差条图 (error bar chart)

例 利用第四章例 4-2 的数据绘制误差条 图,结果显示为图 。从图示可见安慰剂 组的低密度脂蛋白平均值高于所有不同剂量 的新药组,而大剂量新药组的低密度脂蛋白 平均值低于低剂量组和中剂量组,差异有统 计学意义。

练习题 P231 一、最佳选择题 全做 三、计算分析题 第 1 题