统计学导论
统计学导论 1 数据 2 描述性统计 3 概率论初步 4 离散型概率分布 5 正态概率分布 6 置信区间 7 单样本假设检验 8 二样本假设检验 8 相关性和回归 9
第1讲 数据 1. 统计的基本概念 2. 数据的分类 3.试验设计
1.1 统计的基本概念 统计学: 收集、组织、分析和解释数据,并依此作出决断的科学。
1.1 统计的基本概念 1、总体 2、样本 所关心对象的全部结果、响应、测量值或计数值的集合。 总体的一个子集。 样本 总体
1.1 统计的基本概念 举例 1、研究某公司的日光灯寿命 --总体:那家公司所有日光灯的寿命 --样本:所抽取的进行研究的日光灯的寿命 2、研究某农场苹果的单果重量 --总体:该农场所有苹果的单果重量 --样本:所抽取的进行称重的苹果的单果重量
1.1 统计的基本概念 3、参数 4、统计量 对总体特征的数量化描述。 对样本特征的数量化描述。 三个人的平均身高 十个人的平均身高
1.1 统计的基本概念 举例 1、研究某公司的日光灯寿命 --参数:那家公司所有日光灯的平均寿命 --统计量:所抽取的进行研究的日光灯的平均寿命 2、研究某农场苹果的单果重量 --参数:该农场所有苹果的平均单果重量 --统计量:所抽取的进行称重的苹果的平均单果重量
1.1 统计的基本概念 描述性统计: 对数据进行展示、摘要和组织的统计学分支。
1.1 统计的基本概念 推断性统计: 用样本对总体进行推断的统计学分支, 其基本工具是概率论。
1.2 数据的分类 定性数据: 泛指属性、标签或非数量化的条目。 又可分为有序和无序数据。 例如
1.2 数据的分类 定量数据: 泛指数量化的测量值或计数值。 又可分为连续型和离散型数据。 例如
1.2 数据的分类 举例 1、定量数据 --几家公司的日光灯寿命表; --全国各地区生产总值; --某班级各位同学的英语分数; 2、定性数据 --陆地地貌按外表形态可分为山地、高原、丘陵、平原等; --城市按规模可分为大城市、小城市、中等城市; --人口按民族可分为汉族、回族、满族等56个民族;
Levels of Measurement: 1.2 数据的分类 Levels of Measurement: Nominal level and ordinal level 例如
Levels of Measurement: 1.2 数据的分类 Levels of Measurement: Interval level and ratio level
1.3 试验设计 1 统计研究的步骤 2 数据收集方法 3 抽样技术
1.3 试验设计 统计研究的步骤: 设计一个具体的 收集数据方案,如 果利用样本,应保 证样本对总体的代 表性 确定研究的总 体和关心的变量 2 3 设计一个具体的 收集数据方案,如 果利用样本,应保 证样本对总体的代 表性 确定研究的总 体和关心的变量 收集数据 6 4 5 可能的误差解释 用推断性统计解 释数据并对总体 作出统计结论; 用描述性统计技 术对数据进行描 述
1.3 试验设计 统计研究的步骤: 举例--日光灯寿命分析 研究的总体为某工厂所有日光灯的寿命,样本量为所抽取的进行实验的100管日光灯的寿命;探究的主要参数为某工厂所有日光灯的寿命的平均寿命,统计量为所抽取的进行实验的日光灯的平均寿命;收集数据,对仓库内所有的日光灯进行编号,用不放回抽签的方法抽取若干日光灯,进行实验;依次记录100管日光灯的寿命,利用描述性统计技术计算100管日光灯的平均寿命、方差、极差和直方图等;利用推断性统计技术,估计日光灯平均寿命的置信区间等;但由于是样本估计总体,所以存在随机误差等。
1.3 试验设计 数据收集方法 普查 抽样调查 专门组织的一种全面调查 对总体的某一部分进行调查 模拟 实验 对真实事物或者过程的虚拟 科学研究
1.3 试验设计 1、人口普查 2、全国经济普查 1、产品质 量 2、日光灯 寿命 1、经济市 场 2、某条件 下市场经济 下公司收益 抽样调查 模拟 实验 1、人口普查 2、全国经济普查 1、产品质 量 2、日光灯 寿命 1、经济市 场 2、某条件 下市场经济 下公司收益 1、科技产 品 2、对汽车 质量进行防 撞实验
1.3 试验设计 抽样技术 简单随机抽样 分层抽样 聚类抽样 系统抽样 总体中的每一个个体都有相同的机会被抽取 分层抽样是将总体中的所有元素或个体按照某种特征或标志或分为若干个层次,再从这些层次中进行随机抽样组成样本 抽样技术 聚类抽样 系统抽样 若总体自然分成一些子类,而这 些子类有相同的特性。从这些类 中随机抽取一个或几个类作为样本 当总体的每个个体编号后,按预先 的距离抽样所组成的样本。
1.3 试验设计 抽奖 各年级段 男生身体 研究某地区 的土地面积, 以村为单位, 将抽取的村 所有土地入 样; 简单随 机抽样 分层抽样 聚类抽样 系统抽样 如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始,在该页上再另选一个数决定从该行开始。假定选择从第 3 行开始,这就决定了实际开始的位置; 抽奖 各年级段 男生身体 研究某地区 的土地面积, 以村为单位, 将抽取的村 所有土地入 样;