张博恒 MD, PhD 复旦大学循证医学中心 国际临床流行病学上海培训中心

Slides:



Advertisements
Similar presentations
高考短文改错专题 张柱平. 高考短文改错专题 一. 对短文改错的要求 高考短文改错的目的在于测试考生判断发现, 纠正语篇中 语言使用错误的能力, 以及考察考生在语篇中综合运用英 语知识的能力. 二. 高考短文改错的命题特点 高考短文改错题的形式有说明文. 短文故事. 书信等, 具有很 强的实用性.
Advertisements

高考英语短文改错 试题解析 内蒙古师范大学外国语学院 方芳 2011 年 3 月. 一、短文改错设疑方式 此 题要求改正所给短文中的错误。对标有 题号的每一行做出判断: 1) 如无错误,在该行右边横线上画一个 ( );如有错误(每行只有一个错误), 则按下列情况改正:
考研英语复试 口语准备 考研英语口语复试. 考研英语复试 口语准备 服装 谦虚、微笑、自信 态度积极 乐观沉稳.
升中導航— 面試技巧工作坊 學校社工:江曉彤姑娘.
如何与客户有效沟通 外贸团队销售及管理实战培训 浙江艾力斯特健康科技有限公司
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
Presented By: 王信傑 Ricky Wang Date:2010/10/6
神愛世人, 甚至將他的獨生子賜給他們, 叫一切信他的, 不至滅亡, 反得永生。 約翰3:16.
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
宏 观 经 济 学 N.Gregory Mankiw 上海杉达学院.
如何定义和确定参考区间 郭健 卫生部北京医院.
专题八 书面表达.
Helping my child with reading and writing(II)
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
2012高考英语书面表达精品课件:话题作文6 计划与愿望.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
3. 一般問題 部份資料來源: YAHOO網 及本校08年升中學生提供
統計學 授課教師:林志偉 Tel:5021.
one Counting units 2 ones 3 ones.
Module 5.
Ⅱ、从方框里选择合适的单词填空,使句子完整通顺。 [ size beef special large yet ]
Population proportion and sample proportion
Descriptive statistics
What are samples?. Chapter 6 Introduction to Inferential Statistics Sampling and Sampling Designs.
實證醫學 嘉義基督教醫院 外科部 黃國倉醫師
分析化学教程 第二章 分析数据处理及 分析测试的质量保证 (1) 分析化学教程( 学年)
Unit title: 嗨!Hi! Introducing yourself in Chinese
第七章 SPSS的非参数检验.
第 5 章 樣本資料的數值分布.
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
Sampling Theory and Some Important Sampling Distributions
第一章 敘述統計學.
圖表製作 集中指標 0628 統計學.
971研究方法課程第九次上課 認識、理解及選擇一項適當的研究策略
Interval Estimation區間估計
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Try to write He Mengling Daqu Middle School.
基于课程标准的校本课程教学研究 乐清中学 赵海霞.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
Remember the five simple rules to be happy 快樂的五個簡單常規
疾病的流行病学 浙江大学医学部 流行病学与卫生统计学 陈 坤.
Guide to a successful PowerPoint design – simple is best
抽樣分配 Sampling Distributions
資料整理與次數分配 Organizing Data 社會統計(上).
Respect cannot be demanded, it must be earned
相關統計觀念復習 Review II.
Simple Regression (簡單迴歸分析)
Dr. C. Hsieh College of Informatics Kao yuan University
高考应试作文写作训练 5. 正反观点对比.
錢買不到的禮物 自動換頁 音樂:海莉·衛斯頓 演唱<Nada Sousou> 日本電影「淚光閃閃」主題曲英文版.
Remember the five simple rules to be happy 快樂的五個簡單常規
Remember the five simple rules to be happy 快樂的五個簡單常規
統計學簡介 許明宗.
Remember the five simple rules to be happy 快樂的五個簡單常規
Review of Statistics.
医学统计学 (Medical Statistics)
九月十七日 Do now-写中文 Who Name also is/are/am friend.
Unit 1 How do you study for a test?
品質管理與實習 : MIL-STD-105E 何正斌 國立屏東科技大學工業管理學系.
何正斌 博士 國立屏東科技大學工業管理研究所 教授
生物统计学 Biostatistics 第一章 统计数据的收集与整理
Further Development Translation 来自 创思英语 Grammar.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
Sun-Star第六届全国青少年英语口语大赛 全国总决赛 2015年2月 北京
Respect cannot be demanded, it must be earned
Train Track and Children
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

张博恒 MD, PhD 复旦大学循证医学中心 国际临床流行病学上海培训中心 bzhang@zshospital.net 临床统计学介绍 张博恒 MD, PhD 复旦大学循证医学中心 国际临床流行病学上海培训中心 bzhang@zshospital.net

为什么要做统计分析? 统计分析的目的是应用样本 资料的信息,作出有 关研究总体的有效推测。 应用概要性指标描述样本资料来实现。 这些概要性指标保留了足够的信息 去估计研究总 体的特征。 2004-6

关于总体的临床研究问题 在发展中国家,人工喂养相比母乳喂养能否增加母亲为HIV阳性的婴儿生存率? 如何建立一个心脏搭桥手术后生存率模型?病人的特征能否预测术后生存率?相比内科治疗,搭桥手术后1,3,5年的生存率能否改善? 局部治疗小肝癌能否代替外科手术切除? 根治术后应用大剂量的干扰素能否降低肝癌复发率? revised 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

总体,样本和个体 “Aristotle maintained that women have fewer teeth than men; although he was twice married, it never occurred to him to verify this statement by examining his wives’ mouths.” -- Sir Bertrand Russell, The Impact of Science on Society, 1952. “It is a capital mistake to theorize before you have data.” -- Sir Arthur Conan Doyle, Scandal in Bohemia. 2004-6

总体,样本和个体 And, for another viewpoint: “If your experiment needs statistics, you ought to have done a better experiment.” Ernest Rutherford. The bench science perspective: you can control all the variables! Clinicians, however, know better … human variation is large, and often inexplicable. Statistics help us describe it and generalize at least enough to improve our ability to practice medicine. 2004-6

总体,样本和个体 Aristotle 推测了一个女性总体 (比较男性总体). 他实际上手头就有一个包含2个女人的样本 ,他能对这个样本中的2个个体进行数牙。 The population is the collection of all people about whom you would like to ask a research question. This might be a fairly clear-cut easily defined set of people: “What proportion of people 65 or older in the US today have Alzheimer’s disease?” Or it might be a more hypothetical group: “How much of a reduction in symptomatic days could a person expect if treated with a new antiviral for flu?” 2004-6

总体,样本和个体 实际上,我们不可能去研究总体中的每一个对象。 所以,我们研究一个样本, 并将其推广到整个人群。 样本量 是样本中个体 的数目 (而不是对每个研究对象的测量指标数目!) 好的研究设计能帮助我们得到一个 代表性好的样本。 好的统计分析能帮助我们获得关于总体问题的答案。 2004-6

例子:HCC的裸鼠转移模型 免疫重建 对照组 CD3 31.5% 14.2% CD4 XX CD8 * 2个水平:裸鼠 细胞 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

数据类型 计量资料 Quantitative: “how much ?” <> 连续的变量: 年龄, 体重, 身高, 血压 <> 实际数值: 家庭的子女数, 住院天数 分类资料 Categorical: “what type ?” <>等级变量: 肿瘤分期 (I,II,III) ; 好 > 中 > 差 <>名义变量:男/女; 健康/生病; ABO血型 2004-6

数据类型-数据类型的转换 计量数据可转换成分类数据: normal (value) vs. abnormal; “young, middle-aged, old” 将连续变量转换成等级变量减少了资料的信息量,从而造成统计学检验的敏感度或把握度下降 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

分类资料的统计描述 计数 百分比 N = 74 Notes: vertical axis can be count or percent in the above example, counts do not add to 74 … individuals can have multiple risk factors tabular presentation may be more parsimonious for such data 2004-6

分类数据的统计描述 构成比 率 比例 vs 率 标化 2004-6

定量数据的统计描述 下面是一组年龄数据(11例) 21, 32, 34, 34, 42, 44, 46, 48, 52, 56, 64 年龄是一个计量的变量,所以如果用条图就不合适。我们更感兴趣的是年龄分布的一些特征: 年龄分别的中心点在哪里?如平均数 年龄的变异又是如何? 是不是有些数据跟绝大部分数据差得很多(outliers) 借助视觉工具帮助我们回答这些问题. 2004-6

计量数据的统计描述 图表 1. Stem and Leaf plot 2. Histogram 3. Boxplot 数字 1. Location - mean, median, mode. 2. Spread - range, variance, standard deviation,percentile 3. Shape- skewness *例外:生存资料的描述 2004-6

Stem and Leaf Diagram We could group the data and tally the frequencies: But why “hide” the details? Instead, we’ll use the 10’s place as stems and the units as leaves: stem & leaf plot For small datasets 20: X 30: XXX 40: XXXX 50: XX 60: X 2* | 1 3* | 244 4* | 2468 5* | 26 6* | 4 2004-6

平均数 方差 Examples 中位数 百分位数 outlier 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

集中趋势 算术平均数: 几何平均数 中位数 2004-6

平均数和中位数比较 Mean is sensitive to a few very large (or small) values - “outliers” Median is “resistant” to outliers Mean is attractive mathematically 50% of sample is above the median, 50% of sample is below the median. 2004-6

Variation is important! 离散趋势 Variation is important! 2004-6

离散趋势 方差 标准差 百分位数: IQR = Q.75- Q.25 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

标准误和95% 可信区间 描述样本:平均数,标准差 ?总体: 为了估计总体的平均数,需要计算标准误 标准误=标准差/ 样本量 总体均数的95%CI: 样本的平均数±1.96*标准误 论文中常用 2004-6

标准差 vs均数的标准误 ( when do you use one, but not the other ? ) 标准差用于描述:量化样本均数周围的变异. 当确定两个样本是否来自于同一总体时,标准差是一个重要的统计量。 Central limit theorem; “同一总体中的样本均数呈正态分布” 样本均数的标准误用于样本均数估计总体的均数。 标准误是一个重要的统计量,用于计算样本均数的可信度,取决于标准差和样本量。但实际上两者并不独立,当样本量增加时,标准差往往减少。 2004-6

正态分布 ( basis of statistical inference for many populations ) Mean = median = mode. all = same value in the distribution remember: 68.3% of data is between - 1.00 s.d. and + 1.00 s.d. 95.0% “ “ “ “ “ “ “ - 1.96 s.d. and + 1.96 s.d. 95.5% “ “ “ “ “ “ “ - 2.00 s.d. and + 2.00 s.d. 99.7% “ “ “ “ “ “ “ - 3.00 s.d. and + 3.00 s.d. 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

推断性统计 推广结论: 样本 总体 评价证据的强度 比较 预测 2004-6

计量资料的统计方法 正态分布 非正态分布 配对资料(2组) 配对t检验 符号检验 符号等级检验 成组比较 (2组) 成组比较t检验 成组比较 (2组) 成组比较t检验 Wilcoxon Mann & Whitney 中位数检验 配伍组比较 随机区组方差分析 非参数配伍组比较-M检验 多组比较 完全随机设计方差分析 非参数多组比较-H检验 2004-6

列联表分析 行 名义变量 等级变量 一般联系: Pearson’s χ2 行平均得分: (趋势分析) χ2 (趋势分析) 相关分析: χ2 (趋势分析) 相关分析: cmh: χ2 列 * 四格表是全一致 2004-6

Make predictions: 回归分析 应变量: 一般定量变量—— 线性分析 等级或名义变量——Logistic 回归 时间变量 —— Cox回归 2004-6

Index of community mosquito infestation Descriptive epidemiology : pattern of occurrence Prevalence of HIV+ and community Mosquito index r = .83 r - squared = .92 * p < .001 p < .001 * * * * * * * * * * * * * * 20 15 10 5 HIV+ 0 2 4 6 8 10 12 14 16 18 20 22 Index of community mosquito infestation 2004-6

今天的主题 总体,样本和个体 资料的类型: Continuous vs. categorical 如何描述资料? 统计量 和图 测量集中趋势和离散趋势 标准误和95% 可信区间 根据数据选择合适的统计方法 诊断试验评价 2004-6

诊断试验评价 试验的设计 2004-6

诊断试验的设计 2004-6

诊断试验的评价 金标准 有病 无病 试验+ a b 试验- c d 敏感度=a/a+c 特异度=d/b+d 阳性预测值=a/a+b 阴性预测值=d/c+d 阳性拟然比=敏感度/[1-特异度] 阴性拟然比=[1-敏感度]/特异度 2004-6

医学论文中通常报道哪些? 大多数研究报道平均数(正态)或中位数(非正态) 有些研究报道标准差和/或标准误。Be careful!有时会看到图中有一个error bar,could be either. 如果资料非正态 (偏态,多峰,尾巴很长或很短等), 往往报道中位数和百分位数,而不是均数和标准差. 写文章时一定有根主线——研究所要回答的问题: Do you want to ask about the average or typical person? Or do you want to figure out how unusual your patient might be? 2004-6

通常的流行病学(科学的)途径 1. 确定一个问题 : clinical suspicion ; case series ; review of medical literature 2. 组织一个假设 ( asking the right question ) ; good hypotheses are: Specific, Measurable, and Plausible 3. 检验假设 ( assumptions vs. type of data ) 4. 再验证 always Question the VALIDITY of the result(s) : Chance ; Bias ; and Causality 2004-6

结论的准确性 Chance : role of random error in outcome measure(s) ( p - value ; power of the study and the confidence interval ) --- largely determined by sample size Bias : role of systematic error in outcome measure(s) Selection bias - subjects not representativ Information bias - error(s) in subject data / classification Confounding - 3rd variable (causal) assoc. w/ both X and Y 2004-6