7年制规划教材《医学统计学》 主编:余松林 第一章 绪论 宇传华(http://statdtedm.6to23.com)

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

第十三章 医学统计学方法的基本概念和基本步骤
Survey Sampling 問卷調查和訪談
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
1 Chapter 統計學緒論.
第 3 章 資料分類與蒐集 1.進行研究過程中最重要的步驟 2.資料收集與實驗設計具有關連性.
医学科研设计与统计学思维.
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
第1章 统计学的基本概念 什么是统计学 基本概念.
生物醫學統計學.
第二章 研究设计与评价.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
卫生统计学基本概况和基本概念 赵耐青 复旦大学卫生统计教研室.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第 1 章 資料與統計.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
医学统计学 Medical Statistics.
第一章 统计学及其基本概念 南京财经大学统计学系.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
第一章、統計的基本概念 國立高雄餐旅大學 沈瑞棋副教授.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
全国计算机等级考试 二级基础知识 第二章 程序设计基础.
内科护理学实验 1 血糖的监测与护理 实验学时:4学时 实验类型:综合性.
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
初級統計學 陳信如.
面向对象建模技术 软件工程系 林 琳.
敘述統計-資料的特性 Properties of Variable
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
生物统计学 第二章 概率和概率分布
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
生物統計 1 課程簡介 (Introduction)
实验数据处理方法 王永刚.
C语言程序设计 主讲教师:陆幼利.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Chapter 1 統計學緒論. Chapter 1 統計學緒論 Study Report 講述一個神奇而美麗的統計 很多人或許常常在問:「What is Statistics」-統計是甚麼? 統計是製造可信賴的之資料,分析資料的真正意義。 有一列火車上有一位統計學家,一位物理學家和一位數學.
实体描述呈现方法的研究 实验评估 2019/5/1.
6.4 你有信心吗?.
第4章 Excel电子表格制作软件 4.4 函数(一).
統計學簡介 許明宗.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
医学统计学 (Medical Statistics)
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
医学统计方法.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
概率论与数理统计B.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
卫生统计学基本概况和基本概念 赵耐青 复旦大学卫生统计教研室.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
滤波减速器的体积优化 仵凡 Advanced Design Group.
第五章 数理统计的基本知识 §5.1 总体与样本.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
入侵检测技术 大连理工大学软件学院 毕玲.
Sssss.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

7年制规划教材《医学统计学》 主编:余松林 第一章 绪论 宇传华(http://statdtedm.6to23.com)

第一节 概述 统计学(statistics) 第一节 概述 统计学(statistics) 统计学是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。

根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、 医学统计、卫生统计…… 医学统计学(medical statistics):用统计学的原理和方法研究医学中的问题。 卫生统计学(health statistics):与医学统计学基本相同,但更侧重于社会、人群的卫生问题。

为什么要学统计学? 1. 采用统计学方法,发现不确定现象背后隐藏的规律。 变异(variation)是社会和生物医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。

最大值=6.18, 最小值=3.29, 极差=2.89。 算术均数=4.72,标准差=0.57。

2. 用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。

3. 保证你的研究论文能通过统计学审查 据国外60~80年代对不同医学杂志发表论文的调查,有统计错误的论文的百分比最高达72%,最低也有20%。 国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。

JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。 国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:// www.acponline.org

4. 获得循证医学证据的主要手段 “良好愿望的医学”(well-meaning medicine)转入“以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持。 全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。

第二节 医学统计资料的来源与分类 一、原始统计数据的来源 常规保存数据 医院信息系统(HIS)、统计报表等 2. 现场调查记录 第二节 医学统计资料的来源与分类 一、原始统计数据的来源 常规保存数据 医院信息系统(HIS)、统计报表等 2. 现场调查记录 3. 实验记录 4. 其他

定量数据 定性数据 二、统计数据的分类 只有认识了数据的特点,才能正确地选用统计分析方法 按变量测量的精确程度由低到高,将数据分类为:名义数据(如性别、婚姻状况)、有序变量(如疗效,类别间差别大小难以度量)、区间变量(如摄氏体温,类别间差别有实际意义)、比变量(如身高,除具有区间变量的特征外,还具有真实意义的零点。摄氏温度的零点为水结冰时温度,并非绝对意义的零点,所以它不属于比变量) 定性数据

(一)定性与定量数据的别名 2、定量数据(quantitative data) 3、等级资料(ranked data) 1、定性数据(qualitative data) (二项与多项)分类数据(categorical data) 计数数据(enumeration (counting) data) 2、定量数据(quantitative data) 计量数据(measurement data) 区间数据(interval data) 数值数据(numerical data) 3、等级资料(ranked data) 有序资料(ordinal data)

(二)三类数据间的关系 定量数据 等级数据 定性数据 例:一组2040岁成年人的血压 8 正常血压 12 轻度高血压 <8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压 等级数据 定量数据 定性数据 以12kPa为界分为正常与异常两组,统计每组例数

Quantitative data 定量资料 观察单位observations 个体individuals 变量variables Units;elements 住院号 年龄 身高 体重 住院天数 职业 文化程度 分娩方式 妊娠结局 2025655 27 165 71.5 5 无 中学 顺产 足月 2025653 22 160 74.0 小学 助产 2025830 25 158 68.0 6 管理员 大学 2022543 23 161 69.0 剖宫产 2022466 159 62.0 11 商业 2024535 157 2 早产 2025834 20 66.0 4 2019464 24 70.5 3 2025783 29 154 57.0 7 干部 Quantitative data 定量资料 Qualitative data 定性数据

(三)三类数据的编码与计算(1) 定量数据 等级数据 定性数据 例:一组2040岁成年人的血压 8 正常血压 10 2 <8 低血压 4 1 8 正常血压 10 2 12 轻度高血压 13 3 15 中度高血压 16 4 17 重度高血压 18 5 等级数据 定量数据 定性数据 以12kPa为界分为正常(=0)与异常(=1)两组,统计每组例数

(三)三类数据的编码与计算(2) 1.定量数据:允许计算均数、标准差等(可采用t、F检验等,可当做有序或定性数据处理) 2.定性数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等) 调查14名男子的婚姻状况 分类 编码 频数(frequency) 单身 1 3 已婚 2 5 离异 分居 4 3. 有序数据:允许基于顺序的计算,如计算中位数、百分位数(可当做定性数据处理)

第三节 统计学常用的基本概念

Variable and random variable 一、变量与随机变量 Variable and random variable 1、变量——可以测量的任何特征或属性Any characteristic or attribute that can be measured。 (不同个体结果可能不同) 随机变量——在概率论中称变量为随机变量 根据观察数据之间有无缝隙(gap),常将数据分类为离散型(discrete)变量(有缝隙)与连续型(continuous)变量(无缝隙)两大类。

二、测量和测量尺度 对随机变量的取值过程为测量。取值所采用的标准为测量尺度。 采用统一的标准化的尺度进行测量,其测量结果一般是稳定的和一致的,例如身高、胸围等形态指标的测量均采用统一的测量尺度(全国统一研制的身高计、胸围尺均以厘米为记录单位,体重以公斤为记录单位,肺活量以毫升为单位等)

三、 总体与样本 population and sample 总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体 样本:从总体中随机抽取的部分研究对象

随机抽样 random sampling 为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。

四、 参数与统计量 parameter and statistic 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数 总体 样本 抽取部分观察单位 统计量 参 数 推断inference 统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。

五、频率与概率 frequency and probability 样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。 概率:随机事件发生的可能性大小,用大写的P 表示;取值[0,1]。

小概率事件 1 0.5 必然事件 P = 1 随机事件 0 < P < 1 不可能事件 P = 0 Certain 小概率事件 0.5 必然事件 P = 1 随机事件 0 < P < 1 不可能事件 P = 0 P ≤ 0.05(5%)或P ≤ 0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。 Impossible

频率与概率间的关系: 1. 样本频率总是围绕概率上下波动 2. 样本含量n越大,波动幅度越小,频率越接近概率。

六、误差(Error) 偏差 (bias) 测量值=真值+随机误差+非随机误差 1.随机误差(随机抽样误差): Xi=i + i 影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析。 2.系统误差 受确定因素影响,大小变化有方向性。 3.非系统误差(过失误差) 研究者偶然失误而造成的误差。 偏差 (bias)

七、准确度与可靠度 准确度(accuracy)或真实性(validity) :观察值与真值的接近程度,受系统误差的影响(常用指标:如灵敏度、特异度)。 可靠度(reliabiliy)—— 也称精密度(precision)或重复性(repeatability) :重复观察时观察值与其均值的接近程度,受随机误差的影响(常用指标:一致百分率、Kappa值)。

第四节 统计工作的基本步骤 一、研究设计 二、搜集资料 三、整理资料 四、分析资料 五、结果表达

一、研究设计 1.调查设计(survey design) 对研究对象不施加任何干预,通常建立随机抽样(random sampling)方案。 2.实验设计(experiment design) 对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(random allocation)方案。

实验设计的三个基本原则 1.随机化(randomization) 2. 对照(control) 3.重复(replication)

Fisher 在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。 “试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。 统计学家或许只能告诉你试验失败的原因。”

二、搜集资料(data collection) 搜集资料要遵循准确、完整、及时三个原则。 资料搜集计划包括: ① 选择搜集资料的地点、人员和时间; ②搜集资料人员的培训方案; ③预调查或预实验方案拟定; ④资料的记录方式; ⑤调查表的拟订和印刷; ⑥ 调查或实验仪器、试剂的准备; ⑦调查资料的抽样复核比例和方法; ⑧搜集资料所需经费的准备等。

人员选择:高素质、有相关专业基础、以往曾有类似研究经历的人员加以严格培训和管理是能够遵循三原则的保证。 搜集资料的方式:直接观察、采访、填表和通信。 直接观察、采访:调查人员亲自参与和记录,若调查人员素质高,工作认真负责,并接受过统一的培训,调查结果可靠。 填表和通信由被调查者自己填写,若被调查者文化水平高,素质高,乐意配合调查,也可以得到可靠的资料,否则资料的误差较大。

三、整理资料(data sorting) 目的是将搜集到的原始资料系统化、条理化,便于进一步计算与分析。 编码,将数据输入计算机 纠错改错、补漏等

四、分析资料(data analysis) 根据研究设计的目的、要求,资料的类型和分布的特征等选择统计分析方法。 1. 统计描述:即计算统计指标,如平均值、发病率等,绘制统计图。 2.统计推断:即可信区间估计与统计学假设检验 总体均数、总体率的可信区间及其假设检验 两个总体均数、总体率差值的可信区间及其假设检验 多个总体指标之间的假设检验。 3. 多因素回归模型分析等。

五、结果表达 使用的统计学方法 使用的统计学软件 假设检验的统计量、P值等 结论

本章重点内容 数据的分类 统计学常用基本概念

THE END 谢谢!