第十三章 医学统计学方法的基本概念和基本步骤

Slides:



Advertisements
Similar presentations
大象報告 製作:周泓宇圖片:姚勝騰、柯俊安資料:林岑祐. 大象的食物 大象吃青草、樹皮、樹葉等多種不同的食 物。大象用長鼻攀折樹枝、把樹連根拔起, 還把另一些樹的樹皮剝光,讓樹木枯萎。 大象就這樣把森林變為開闊的林地,使燎 原野火易於發生,終於把那個地帶變為無 樹平原。大象喜愛有樹的地方。從前大象.
Advertisements

中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
得獎作品.
春季常见传染病预防知识.
苏炳华 教授 上海第二医科大学 生物统计学教研室
狗的種類 作者:麥澤洋.
自我介紹 班級:運促一甲 學號:D 姓名:張晉輔.
專題研究 第一講 教育研究模式 第二講 專題計畫書之擬定及研究主題選擇 第三講 實驗法 第四講 測驗法 第五講 問卷調查法
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
迴歸分析與軟體應用 林 國 欽 博士 商學與管理研究所 台南科技大學.
1 Chapter 統計學緒論.
医学科研设计与统计学思维.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月
第1章 统计学的基本概念 什么是统计学 基本概念.
社区营养管理与干预 第四军医大学唐都医院 叶琳 Tel: ,
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第一章 緒論.
生物醫學統計學.
白酒生产工艺 项目三 酒曲生产技术.
血压测量及练习.
实习19 流行病学数据分析常用软件.
愛錢又搞笑的日本警察 兩津勘吉.
防治高血压 护理新举措.
第二章 研究设计与评价.
烟草栽培学 南平农校 杨志和.
統計調查管理研習班 統計調查抽樣設計 鄭宇庭 國立政治大學統計學系.
走进哆啦A梦的生活.
第 1 章 資料與統計.
医学统计学 Medical Statistics.
机械性损伤病人的护理 ——胸部损伤病人的护理
拒绝危险驾驶  安全文明出行 2015全国交通安全日专题课件.
统计学Statistics 主讲人:商学院 刘后平 教授
第一章 统计学及其基本概念 南京财经大学统计学系.
第一章、統計的基本概念 國立高雄餐旅大學 沈瑞棋副教授.
河北省部分社区建档高血压患者血压与体重基线水平分析
歡迎來認識黃金獵犬 黃金獵犬的神祕小世界.
統計學 授課教師:林志偉 Tel:5021.
Service survey center, NBS
初級統計學 陳信如.
现场调查问卷的数据管理 Survey Data Management
第11章 抽樣設計 本章的學習主題 1.抽樣的基本概念 2.抽樣的程序 3.機率抽樣 4.非機率抽樣 5.電話抽樣
研究方法 Research Methodology
Marketing Research and Analysis
統計方法與資料分析 劉文雄 老師.
4 統計分析程序的選擇.
Workshop on Statistical Analysis
第四章 抽樣與抽樣分配 4.1 抽樣與抽樣方法 抽樣分配概論 常見的抽樣分配 中央極限定理55
生物統計 1 課程簡介 (Introduction)
实验数据处理方法 王永刚.
Introduction to Basic Statistics
自我介紹 大同國中 湯晴雯.
抽樣分配 Sampling Distributions
相關統計觀念復習 Review II.
Introduction to Basic Statistics
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
Chapter 1 統計學緒論. Chapter 1 統計學緒論 Study Report 講述一個神奇而美麗的統計 很多人或許常常在問:「What is Statistics」-統計是甚麼? 統計是製造可信賴的之資料,分析資料的真正意義。 有一列火車上有一位統計學家,一位物理學家和一位數學.
統計學簡介 許明宗.
医学统计学 (Medical Statistics)
医学统计方法.
Biostatistics 生物統計學 醫學影像處理實驗室.
品質管理與實習 : MIL-STD-105E 何正斌 國立屏東科技大學工業管理學系.
Logistic回归 Logistic regression 研究生《医学统计学》.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
生物统计学 Biostatistics 第一章 统计数据的收集与整理
Probability Statistics p65 ~ 85 & p119~ /6/7
第七章 计量资料的统计分析.
第一章 概說.
数据处理过程中的质量控制 寇长贵(副教授) Tel: Mail:
Presentation transcript:

第十三章 医学统计学方法的基本概念和基本步骤

医学统计学的学习要求: 理解基本的统计原理 正确选择、运用统计分析方法 培养基本的统计思维能力 不要求: 公式的推导和记忆、 复杂的手工计算 不要求: 公式的推导和记忆、 复杂的手工计算 2

教材:预防医学 施榕主编 内容: 第十三章 医学统计学方法的基本概念和基本步骤 第十四章 数值变量的统计描述 第十五章 数值变量的统计推断 第十六章 分类变量的统计描述 第十七章 分类资料的统计推断 第十八章 秩和检验 第十九章 直线相关与回归分析 第二十一章 统计表和统计图

本节主要内容 第一节 统计学的几个基本概念 第二节 医学统计工作的基本步骤

一、什么是医学统计学? 例1:比较两种疗法对活动期十二指肠球部溃疡。 一组:口服呋喃硝铵,有效率90%; 另一组:口服西咪替丁,有效率85% 问:能否立即下结论,呋喃硝铵疗效高于西咪替丁?

医学统计学:应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的一门应用性学科。 是指导人们如何对科研问题进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断的科学,帮助揭示疾病或现象的发生、发展规律,为预防疾病、促进健康提供客观依据。

二、为什么要学统计学? 1. 采用统计学方法,发现不确定现象背后隐藏的规律。 变异(variation):是社会和医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人的身高、体重、血压等各有不同。

2.用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。

3. 保证你的研究论文能通过统计学审查 据国外60~80年代对不同医学杂志发表论文的调查结果显示,有统计错误的论文所占比例高达72%,最低也有20%。 国内1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。 某研究者1996年对4586篇论文统计(中华医学会系列杂志仅占6.9%),数据分析方法误用达55.7%。

JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。 国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学要求。 Uniform Requirements for Manuscripts Submitted to Biomedical Journals http:// www.acponline.org

第一节 统计学的几个基本概念

一、 总体和样本 population and sample 观察单位(observation unit): 统计研究中的最基本单位,可以是一个人、一个家庭、一个地区、一个样品。 总体:是指根据研究目的确定的性质相同的观察单位的全体。 更确切地说,是同质的所有观察单位某项观察值(变量值)的集合。

homogeneity and variation 同质和变异 homogeneity and variation 同质:是指除了实验因素外,影响被研究指标的非实验因素相同。即研究对象的性质相同。 变异:是指在同质的基础上,被观察个体之间观察指标的差异。

同质和变异 例1 调查2007年上海市7岁男童的身高和体重 同质:2007年、上海市、7岁男童 变异:身高和体重各不相同 例1 调查2007年上海市7岁男童的身高和体重 同质:2007年、上海市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同

总体和样本 研究目的 观察单位 变 量 值 总 体 有 限 总 体 研究某地2002年正常成人白细胞数 每个正常成人 每人测得的白细胞数 变 量 值 每人测得的白细胞数 该地2002年全部正常成人的白细胞数 总 体 同质基础:同一地区、同一年份、同为正常人、

无限总体 例如:研究用珍菊降压片高血压患者治疗后的疗效 同质基础:同为高血压患者、同用珍菊降压片治疗 总体:包括设想用该药治疗的所有高血压患者的治疗效果 这个结果没有时间和空间的限制,观察单位数无限 无限总体

有限总体和无限总体 有限总体:总体中所包含的个体数目是可以掌握的,有空间、时间的限制。 无限总体:没有具体的空间、时间的限制,所包含的个体数目是未知的。(设想的、或抽象的)

总体 调查某地2002年正常成人的白细胞数 —— 总体 从某地2002年正常成人随机抽取150人,分别测其白细胞数,组成样本。—— 样本 调查某地2002年正常成人的白细胞数 —— 总体 从某地2002年正常成人随机抽取150人,分别测其白细胞数,组成样本。—— 样本 总体 抽取部分观察单位 样本 推断inference 参 数 统计量

抽样时必须遵循随机化原则 样本: 是从总体中随机抽取的具有代表性的一部分观察单位其某项指标的实测值的集合。 抽样(sampling):从总体中抽取部分个体的过程。 样本含量(sample size) :样本包含的观察单位的数称为样本含量、样本大小或样本例数 如何正确地由样本反映总体呢? 抽样时必须遵循随机化原则

随机性: 总体中每个个体都有相同的机会被抽取到样本 随机不等于随意 随机抽样的实现:随机数字表

parameter and statistic 参数和统计量 parameter and statistic 参数: 根据总体个体值计算出来的描述总体特征的的指标。 希腊字母表示:如总体均数μ、总体标准差σ、总体率π等。 是固定的常数 但一般未知。 普查 统计量: 根据样本个体值计算出来的描述样本特征的指标 拉丁字母表示:如样本均数、样本率p等。 在参数附近随机波动。 抽样调查

二、抽样误差( random sampling error): 由于抽样所引起的样本统计量与总体参数之间的差异称为抽样误差。 产生的原因: 1.个体之间存在变异 2.抽样时只能抽取总体中的一部分作为样本 不可避免 但有一定的分布规律,可估计;并在一定范围内控制抽样误差

三、变量及其分类 实验或调查研究中的观察指标称为随机变量(random variable); 变量的观测值称为变量值(variable value)或观察值(observed value) 由变量值构成资料(data)

根据变量值是否定量可分为 数值变量(numerical variable):计量资料 分类变量(categorical variable): 无序分类变量(unordered categorical variable )计数资料 有序分类变量(ordinal categorical variable ) 等级资料

1. 计量资料(measurement data): 定义:用定量方法对观察单位准确测量后所得的资料。 变量值是定量的,表现为数值大小 ,多有度量衡单位。 特点: 有度量衡单位 多为连续性资料 例如:身高(cm)、体重(kg) 血压(mmHg)、脉搏(次/分) 红细胞计数(1012/L) 25

2.计数资料(enumeration data) 定义:用定性的方法得到的资料。 按观察单位某种性质或特征分组后,再分别清点各组观察单位的个数。 变量表现为互不相容的类别或属性 特点:没有度量衡单位 多为间断性资料 例如:肤色(黑、白)——二项分类 血型(ABO)——多项分类 职业(工农兵)——多项分类 性别(男女) ——二项分类 26

3.等级资料 (ranked data) 定义:将观察单位按某种属性的不同程度分成等级后分组计数所得的资料。 是介于计量资料和计数资料之间的一种资料 特点:其变量值具有半定量性质 表现为等级大小或属性程度 例如: ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上

实例数据1

实例数据2

4. 三类资料间关系 例:一组2040岁成年人的血压 计量 资料 等级资料 计数 资料 <8 低血压 8 正常血压 <8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压 等级资料 计数 资料 以12kPa为界分为正常与异常两组,统计每组例数

四、概率(probability ) 确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件: 肯定发生某种结果的叫必然事件; 肯定不发生某种结果的叫不可能事件。 随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。 随机事件:在一定条件下某一现象可能发生也可能不发生的事件。 随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的或者可以估计的。

概率( probability ):是反映某一随机事件发生的可能性大小的一个量度,记为P,取值 [0,1]。 P<0.05或P<0.01的随机事件称为小概率事件 统计学上认为1次抽样中不大可能发生。 1 Certain 0.5 Impossible

频 率 (frequency ) 频率(frequency) :指样本的实际发生率。设在相同条件下,独立重复进行n次试验,随机事件A出现f 次,则事件A出现的频率为f /n。 例如投掷硬币,历史上有人对此做过实验得到如下结果:

频率与概率间的关系 样本频率总是围绕概率上下波动 样本含量n越大,波动幅度越小,频率越接近 概率。 频率常用于估计概率:当n→∝时,f /n→ P(A)。

第二节 医学统计学的基本步骤 设 计:包括观察性研究设计和实验性 研究设计 2. 收集资料:取得准确可靠的原始资料 设 计:包括观察性研究设计和实验性 研究设计 2. 收集资料:取得准确可靠的原始资料 3. 整理资料:对资料进行清理、改错,数量化 4. 分析资料:统计描述、统计推断

1、设计(design) 定义:是在保证科学性、可重复性和高效性的前提下,为验证研究假说而制定周密的医学研究计划。 在广泛的查阅文献、全面了解现状、广泛征询意见的基础上,对将要进行的研究工作所作的全面的设想。

1、设计(design)的分类: 调查设计(survey design):对研究对象不施加任何干预,通常建立随机抽样(random sampling)方案。 搜集资料在整个研究设计中占主要地位. 实验设计(experiment design):对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(random allocation)方案。

2、设计(design)的内容 (1)明确研究目的和研究假说。 (2)确定研究对象与观察单位、样本含量和抽样方法。 (3)是否施加干预,如何施加干预?如何设置对照? (4)设置观察指标。 (5)需搜集哪些原始资料,用什么方法 ? (6)如何对取得资料作进一步的整理和汇总,计算统计 指标。 (7)如何控制误差。 (8)预期会得到什么结果。 (9)研究进度和经费的安排等。

Fisher 在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。 “试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。 统计学家或许只能告诉你试验失败的原因。”

2、收集资料(data collection) 收集资料:根据研究目的收集准确、完整的原始资料。 资料的来源: 1、统计报表:疫情报表、医院工作报表等; 2、登记和报告卡(单):传染病和职业病发病报告卡,肿瘤发病及死亡报告卡,出生及死亡报告单等; 3、日常医疗卫生工作记录:如门诊病例、住院病例、健康检查记录、卫生监测记录等 4、专题调查或实验研究:开展医学科研的主要资料来源 前三种都有局限性。

资料收集计划 ①选择搜集资料的地点、人员和时间; ②搜集资料人员的培训方案; ③预调查或预实验方案拟定; ④资料的记录方式; ⑤调查表的拟订和印刷; ⑥调查或实验仪器、试剂的准备; ⑦调查资料的抽样复核比例和方法; ⑧搜集资料所需经费的准备等。

3、整理资料(data sorting) 目的是对搜集到的原始资料其系统化和条理化,便于进一步计算统计指标和深入分析。 资料整理前要对资料再次检查与核对,发现缺项或错项较多的调查表,须补查或剔除。审查无误后,设计分组。

资料整理的过程 1、对原始数据进行核对和检查。 2、设计分组。 (1)质量分组:按属性或类别归类分组; (2)数量分组:按数值大小分组。 3、按分组要求设计整理表,汇总资料。

可借助于计算机软件(EpiData, Study -Builder, Excel)来完成。 1、编码,将数据输入计算机 2、纠错改错、补漏等

4、分析资料(data analysis) 运用统计学的基本原理和方法,根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计分析方法,进行一系列的统计描述和统计推断,揭示事物内部的规律。 可借助于计算机(常用软件:SPSS、SAS、STATA)完成。

统计描述(descriptive statistics) 是指用统计指标和适宜的统计图、统计表等方法,描述统计资料的分布规律及其数量特征。 4、分析资料(data analysis) 统计描述(descriptive statistics) 是指用统计指标和适宜的统计图、统计表等方法,描述统计资料的分布规律及其数量特征。 统计推断(inferential statistics) 是通过随机样本信息推断总体特征的过程。 参数估计(parameter estimation) 假设检验(hypothesis test)

三、STATA软件:分析能力强,速度极快! 图形精美 四、EPI INFO:流行病学调查得数据管理软件。 第二十二章 常用统计分析软件简介(284页) 一、SPSS(PASW)软件: 二、SAS软件:统计专业用户 三、STATA软件:分析能力强,速度极快! 图形精美 四、EPI INFO:流行病学调查得数据管理软件。

SPSS软件 美国斯坦福大学研制,目前已被IBM兼并。最新版本19.0. 特点:界面友好、使用方便、功能齐全。

SPSS软件 谢谢