Presentation is loading. Please wait.

Presentation is loading. Please wait.

描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)

Similar presentations


Presentation on theme: "描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)"— Presentation transcript:

1 描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
(北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系) 翻译 lvruiqin(DXY) 这篇讲稿中我们将讲述基本的统计概念。 作者 Dr. Maria Correa-Prisant (北北卡罗来纳州立大学兽医学院微生物学、病理学和寄生虫学系) 翻译 lvruiqin(DXY)

2 描述性统计学 对所得数据有一个总体“感觉” 评价数据的质量 变量的类型 概括性统计学 分布 图形描述
与临床工作相比较,这是一条了解就诊者“数据集”的途径。

3 变量的类型 连续型:温度、心率等 高斯分布(Gaussian distribution),钟罩形 离散变量、分类变量
定序型数据(Ordinal):腹痛的程度、肿瘤大小 定类型数据(Nominal):品种、性别 二项数据(Binominal):是或否、出席或缺席 有许多不同类型的变量。辨别它们的类型很重要,因为这决定了我们用何种统计分析方法。

4 正态和偏态分布 尾部(tail) 对称 均值、众数、中位数 单峰 偏向左侧 众数、中位数 单峰 这些是连续型数据不同分布的图形描述 双峰

5 变量或分布的类型决定了所使用的统计方法 连续型 定序型 定义新的变量或者进行转变 使用非参数检验 使用连续型变量的检验
不能对定序或定类型变量使用连续型变量适用的检验。 定义新的变量或者进行转变 使用非参数检验 使用连续型变量的检验

6 集中趋势和离散 集中趋势的测度 均值(Mean)、中位数(Median)、众数(Mode) 离散程度的测度
标准差(Standard deviation)、百分位数(percentiles) 正态分布数据的均值、中位数、众数重叠。

7 集中趋势的测度:均值(Mean) 均值(Mean):对于连续型数据而言 此处,X1,X2,…,Xn是独立的值并且N是测量的总数。
只对于连续型变量。

8 均值、中位数、众数 呼吸频率 甲组=(11,12,13,14,15) ;均值=13 均值为极端值所影响
乙组=(11,12,13,13,14,25);均值=15 均值为极端值所影响 中位数是13: 分割数据成50:50的值(数据按升序或降序排列) 众数是13:出现最多的数 数据非正态分布时,均值不宜作为集中趋势的测度。

9 集中趋势的测度

10 离散程度的测度 标准差(Standard deviation) 1sd,2sd,3sd 百分位数(Percentiles)
25,50,75,90,95 极差(Range) 最大值-最小值 数据的离散程度可以用标准差或百分位数表达。当数据非正态分布时用标准差不恰当。

11 标准差 方差 2倍的标准差经常用到

12 百分位数 四分之一分位数=25% 四分之二分位数=50% 30%上侧 70%下侧 第70个百分位数值
将数据简单地分为100份,百分位数不是由数据的分布决定的。 30%上侧 70%下侧 第70个百分位数值

13 白细胞计数 大猩猩属(Gorilla gorilla ) 茎叶图(Stem Leaf) N:29个大猩猩
数据显示和摘要 N:29个大猩猩 平均白细胞数:10.3 SD 5.02 中位数:8.3

14 佛罗里达海牛(Florida Manatee)
大猩猩属 佛罗里达海牛(Florida Manatee) 淋巴细胞 单核细胞 总蛋白质 重量

15 均值的置信区间(Confidence Interval for the Mean)
首先得到几组均值的均值,再计算这几组均值的均值的标准误差(Standard Error)。 更多样本

16 分类数据 肿瘤大小 小,中,大 甲组:1,1,2,2,2,2,2,3 1, 2, 乙组:1,2,2,3,3,3,3,3 均值=NO! 同时, 中位数=YES! 频数 众数=YES! 比例 直方图 对于分类型数据,不能计算均值,那样做没有意义。

17 交叉列联表和图表说明 频数表 比例:肿瘤大小为1,甲组中占2/3 组别 甲 乙 肿瘤大小 每个细胞观察到的数目
甲 乙 肿瘤大小 将数据填入R×C列联表将会使你对例子有更好的了解。 每个细胞观察到的数目

18 联系 联系并不意味着因果关系 因果关系是联系的一种特殊形式 联系的检验——定义假设 标准包括力度、短暂性、生物梯度、一致性等
零假设——想要拒绝的 备择假设 用统计检验确定关联。我们不能“证明”。我们说,要么我们没有足够的把握(不能拒绝零假设——译者注),要么我们拒绝零假设。


Download ppt "描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)"

Similar presentations


Ads by Google