社会研究方法 第6讲:社会统计1.

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

摆一摆,想一想. 棋子个数数的个数 摆出的数 、 10 2 、 11 、 20 3 、 12 、 21 、 30 4 、 13 、 22 、 31 、 40 5 、 14 、 23 、 32 、 41 、

因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
数的顺序 比较大小 3 、口答 ( 1 )一个两位数,个位上是 7 ,十位上是 6 , 这个数是( )。 ( 2 )一个数,百位上是 1 ,十位、个位上都 是 0 ,这个数是( )。 1 、读数: 43 、 55 、 67 、 100 、 91 2 、写数:五十二、八十九、四十、七十三、一百.
第四单元 100 以内数的认识
冀教版四年级数学上册 本节课我们主要来学习 2 、 3 、 5 的倍数特征,同学们要注意观察 和总结规律,掌握 2 、 3 、 5 的倍 数分别有什么特点,并且能够按 要求找出符合条件的数。
人教新课标一年级数学下册. 教学目标 1. 初步掌握 100 以内数的顺序。 2. 初步会比较 100 以内数的大小。 3. 初步结合具体事物,使同学们 感 受 100 以内数的意义,会用 100 以 内的数表示日常生活中的事物, 并进行简单的估计和交流。
第四单元 100 以内数的认识
重庆市九龙坡区走马小学 邓华. 一、复习导入,揭示课题 下面哪些数是 2 的倍数?哪些数是 5 的倍数? 2,5的倍数的特征:只看个位上数就能进行判断。 2的倍数:个位上是0,2,4,6,8的数。
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
《解析几何》 -Chapter 3 §7 空间两直线的相关位置.
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
資料分析 ---敘述統計分析.
Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法
10.2 立方根.
第二章 计量资料的统计描述 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定.
統計學 郭信霖 許淑卿.
四种命题 2 垂直.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/13.
不确定度的传递与合成 间接测量结果不确定度的评估
余角、补角.
直线和圆的位置关系.
第十四章 数值变量的统计描述.
第 5 章 樣本資料的數值分布.
敘述統計-資料的特性 Properties of Variable
第一章 敘述統計學.
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
第十章 方差分析.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
2.1.2 空间中直线与直线 之间的位置关系.
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
数列.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
模型分类问题 Presented by 刘婷婷 苏琬琳.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
Dr. C. Hsieh College of Informatics Kao yuan University
Descriptive Statistics
用计算器开方.
实体描述呈现方法的研究 实验评估 2019/5/1.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
统计图表绘制 电子工业出版社.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/11.
可编辑图表汇总 修改方法: 点击图表内容→“设计”选项卡→编辑数据.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第八章 总线技术 8.1 概述 8.2 局部总线 8.3 系统总线 8.4 通信总线.
第4课时 绝对值.
(四)标准差(standard deviation)
楊志強 博士 統計學 楊志強 博士
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
分数再认识三 真假带分数的练习课.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
2、5、3的倍数的特征.
第七章 计量资料的统计分析.
找 因 数.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
位似.
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

社会研究方法 第6讲:社会统计1

统计分析: 描述统计指的是描述数据的方法。 推论统计则帮助研究者根据观察数据得出结论,通过对样本的研究进而推论总体。

先复习一下不同测量层次的变量 根据社会现象具有不同的性质和特征,因此对它们的测量也具 有不同的层次。测量层次可分为四类: 定类:将不同属性进行分类(nominal) 定序:确定等级和次序 (ordinal) 定距:确定相互之间不同等级的间隔距离和数量差别 (interval) 定比:具有以上三种测量的全部性质,还具有一个绝对 的零点。(ratio)

单变量描述统计 频数分布(frequency distribution):对变量的不同属性出现次 数的描述。可适用于定类、定序、定距和定比数据。

举例:400位被访者的信息。可以用以下两种方式来列出被访者的性别信息。即用原始计数和百分比频数分布的方式。

对于定距或定比资料,需要把资料分成不同的组。

频数分布(frequency distribution): 也可以用图形的方式展示, 例如直方图histogram, 柱形图bar chart, 饼状图pie chart. Bar chart &pie chart适用于离散变量 .histogram适用于定距 和定比数据。

柱状图

饼状图

集中趋势的测量 三种集中趋势的测量方式: 众数Mode:代表最常出现的观察值。适用于所有四类变量。 举例:6,5,7,10,9,5,3,5 (众数是5) 举例:5,6,1,2,5,7,4,7(众数是5和7) 举例:17,20,26,30,50,70 (没有众数) 中位数Median:按顺序排列后观察属性最中间的那个属性。适 用于定序,定距和定比变量(不适用于定类) 若奇数个数字,则比较简单。例如:12 17 20 27 30 55 80 ,中位数为27. 若偶数个数字,则中间两个数字加总后再除以2.例如,17 20 26 30 50 70. 中位数是26+30/2=28 平均数Mean:适用于定距或定比数据。容易受到极值的影响。

如果频数分布是一个正态分布(normal distribution),那么三个集中趋势的值都会相等。但是如果分布是一个偏态分布(skewed distribution), 中位数则较好的表示其集中趋势。

离散趋势测量:反映数据的分布(spread, dispersion, variability around the center),即中心点向外散布、离散或变异的程度。 比较一下以下两群人: 第一组7个人,年龄分别为 25,26,27,30,33,34,35. 第二组7个人,年龄分别为5,10,20,30,40,50,55

离散趋势测量:反映数据的分布(spread, dispersion, variability around the center),即中心点向外散布、离散或变异的程度。 比较一下以下两群人: 第一组7个人,年龄分别为 25,26,27,30,33,34,35. 第二组7个人,年龄分别为5,10,20,30,40,50,55 这两组人的平均年龄都是30岁,但是第二组的年龄分布离中心的 分散程度较远,或者说这个分布有较大的变异。

离散趋势测量:反映数据的分布(spread, dispersion, variability around the center),即中心点向外散布、离散或变异的程度。 有三种方法来测量离散趋势: 全距/极差range :max-min (适用于定序,定距,定比)

百分位数(percentile):一组n个观察值按照数值 大小排列,如,处于p%位置的数值成为第p百分位数。如 中位数就是第50个百分位数。 (适用于定序,定距,定比) 四分位数(Quartile),即把所有数值由小到大排列并分成四 等份,处于三个分割点位置的数值就是四分位数。 第一四分位数 (Q1),又称“较小四分位数”,等于该样 本中所有数值由小到大排列后第25%的数字。 第二四分位数 (Q2),又称“中位数”,等于该样本中所 有数值由小到大排列后第50%的数字。 第三四分位数 (Q3),又称“较大四分位数”,等于该样 本中所有数值由小到大排列后第75%的数字。 第三四分位数与第一四分位数的差距又称四分位距( InterQuartile Range,IQR)。

标准差standard deviation:适用于定距和定比数据。指的是数据 离平均数的平均距离。 标准差主要用于子群比较。高的标准差意味着该数据比较离散; 低的标准差意味着资料比较聚集。例如,班级A的父母教育年限的 标准差是6年。班级B的学生的父母教育年限的标准差是0.8年。这 说明班级A的父母的教育背景差异很大(异质性高),班级B的父 母教育背景比较相似(同质性高)。

练习

双变量关系:变量与变量之间的关系 双变量统计分析告诉我们变量间的统计关系。 两个重要的概念:协变(covariation)和独立(independence). 协变是指事情一起发生或有所相关。例如,收入和生活期望相 关。 独立(independence)指的是变量间没有相关或没有关系。 有三种方法来探究两个变量之间是否有关系存在:1)散点图,2) 交互表,3)相关系数

散点图 通常自变量被放在X轴上,因变量在Y轴上。 用于定距或定比数据。

散点图 从散点图中可以看到双变量关系的三个层面: 形式: 独立或没有关系 直线关系 曲线关系:U型,倒U型,S型 方向:正面或负面的直线关系 精确程度:指的是图形上各点的散布程度。高精确度-各点位 于直线附近,低精确度-各点广泛分布在直线两侧

交互表(交叉表) 适用于任何一种测量层次的数据。但是如果是定距和定比数据, 则是先要分组,转化为定序变量。 交互表内的数字通常是百分比。

如何制作交互表?举例:年龄和态度的关系。年龄是一个定比数据,因此先把它分组。年龄有4个类别,态度有3个类别,因此该表中有4*3=12格。

转化为百分比表

如何制作百分比表 是按行还是列求百分比更好?根据你的研究假设。 如果研究假设是年龄会影响态度,那么列百分比会比较有用。 (根据原因因素的方向计算百分比) 如果研究兴趣在于描述不同态度的人的年龄组成,那么行百分 比就比较合适。 经验:构建交互表时,需要对变量间因果关系的逻辑有思考( 自变量通常是在column) 一般自变量作列,因变量作行

如何阅读百分比表 看清标题、变量名称 注意百分表计算的方向:按行还是按列 阅读百分表表是为了进行比较。比较的方向和百分比计算的方 向相反。一个经验法则:如果表是向下求得百分比(即按列计 算),就跨行比较。如果表是横向求得百分比(即按行计算) ,就比较列的差异。

练习:交互表(cross tabulation)构建交互表时,需要对变量间因果关系的逻辑有思考(自变量通常是在column) 1)有哪些变量?2)因变量?自变量?3)研究假设?4)表格中11%表示什么?5)研究发现?

交互表(cross tabulation)构建交互表时,需要对变量间因果关系的逻辑有思考(自变量通常是在column) 我们想了解有关报纸社论对于大麻合法化的立场。想检验的是社论立场和报纸出版的社区类型之间的关系。我们预测农村地区的报纸可能比城市地区的报纸更保守。 结果显示:农村比城市更不支持大麻合法化。因为32%的城市报纸支持立场,而农村报纸只有11%。

没有百分比的双变量表 其中一个变量是定类或定序变量,而另一个变量是定距或定比 变量。 在定类或定序变量的每个类别中列出定距或定比变量的均值( 或类似的量数)。

图表中显示的是每个态度类别中被访者的平均年龄。如何解读?

图表中显示的是每个态度类别中被访者的平均年龄。不同意的被访者的平均年龄要比同意或没有意见的那些被访者的平均年龄要大。

相关测量 两个变量之间的相关关系(measures of association) 相关程度的强弱 相关的方向(正相关和负相关) 相关性测量依据的是消减误差比例( proportionate reduction in error (PRE)).相关性测量是根据一个变量值 去猜测另一个变量值的能力。相关性越大,降低错误的概率变 越大。 相关测量值有很多种,采用哪一种视测量层次而定。