Presentation is loading. Please wait.

Presentation is loading. Please wait.

统 计 学 (第三版) 2008 作者 贾俊平 统计学.

Similar presentations


Presentation on theme: "统 计 学 (第三版) 2008 作者 贾俊平 统计学."— Presentation transcript:

1 统 计 学 (第三版) 2008 作者 贾俊平 统计学

2 图并没有说谎,是说谎者在画图。 ——Benjamin Disraeli
统计名言 图并没有说谎,是说谎者在画图。 ——Benjamin Disraeli 2008年8月

3 2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表
第 2 章 用图表展示数据 2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表

4 学习目标 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形
合理使用图表 2008年8月

5 男学生更容易逃课吗? 读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生每周平均逃课次数的汇总表如下 2008年8月

6 男学生更容易逃课吗? 逃课情况 男 女 合计 几乎一次不逃 28 49 77 1到3次 24 31 55 3到5次 6 4 10 5次以上
其他 1 2 62 89 151 你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你选择使用呢? 2008年8月

7 第 2 章 用图表展示数据 2.1 用图表展示定性数据 生成频数分布表 定性数据的图示

8 2.1 用图表展示定性数据 生成频数分布表

9   生成频数分布表 (定性数据) 1. 列出各类别 3. 生成频数分布表 2. 计算各类别的频数 2008年8月 分类 频数 比例
1. 列出各类别 2. 计算各类别的频数 3. 生成频数分布表 分类 频数 比例 百分比 比率 A B C D E 2008年8月

10 生成频数分布表 (定性数据) 用Excel制作频数分布表
【例】一家市场调查公司为研究不同类型饮料的市场占有率,对随机抽取的一家超市进行调查。下面的表是调查员随机观察的50名顾客购买的饮料类型记录。生成一张频数分布表,观察不同类型饮料的销售分布状况 用Excel制作频数分布表 2008年8月

11 使用Excel数据透视表数计数 (pivot table)
第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域 第4步:在【向导—3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将“分类变量“(这里 是饮料品牌)连续拖放两次:一次拖至左边的“行”区域 ,一次拖至 “数据”区域 第6步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表 用数据透视表产生定性数据的频数分布 2008年8月

12 生成频数分布表 (定性数据) 不同类型饮料的频数分布 2008年8月

13 定性数据的描述统计量 频数(frequency) :落在各类别中的数据个数
比例(proportion) :某一类别数据个数占全部数据个数的比值 百分比(percentage) :将对比的基数作为100而计算的比值 比率(ratio) :不同类别数值个数的比值 2008年8月

14 2.1 用图表展示定性数据 定性数据的图示

15 条形图 (bar Chart) 用宽度相同的条形的高度或长短来表示各类别数据
各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(column chart) 2008年8月

16 帕累托图 (pareto chart) 按各类别数据出现的频数多少排序后绘制的柱形图 用于展示分类数据的分布 2008年8月

17 饼图 (pie Chart) 用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例 用于研究结构问题 2008年8月

18 环形图 (doughnut chart) 环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示 与饼图类似,但又有区别
饼图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环 用于结构比较研究 2008年8月

19 环形图 (doughnut chart) 【例】2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成 2008年8月

20 环形图 (doughnut chart ) 北京、上海和天津地区按收入法计算的地区生产总值 2008年8月

21 第 2 章 用图表展示数据 2.2 用图表展示定量数据 生成频数分布表 定量数据的图示

22 2.1 用图表展示定性数据 生成频数分布表

23 生成频数分布表 (例题分析) 【例】某电脑公司2008年前4个月各天的销售量数据(单位:台)。生成一张频数分布表观察销售额分布的特征
2008年8月

24 生成频数分布表 (例题分析) 确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K 15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 例如,本例最大值为237,最小值为141,组距=( )÷10=9.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足a<xb(上限值不在内 2008年8月

25 分组中的几个概念 1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值
3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 下限值+上限值 2 组中值 = 用Excel制作频数分布 2008年8月

26 生成频数分布表 (例题分析) 某电脑公司销售额的频数分布 2008年8月

27 生成频数分布表 (例题分析—使用开口组) 2008年8月

28 使用Excel频数函数 (FREQUENCY)
选择与接受区域相临近的单元格区域,作为频数分布表输出的区域 选择统计函数中的【FREQUENCY】函数 在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域 同时按下“ctrl-shift-Enter”组合键,即得到频数分布 统计函数—FREQUENCY 2008年8月

29 2.1 用图表展示定性数据 定量数据的图示 Excel

30 分组数据看分布—直方图 (histogram)
用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1 用Excel制作直方图 2008年8月

31 用SPSS绘制直方图 第1步:选择【Graphs】下拉菜单,并选择 【histogram】选项进入主对话框
第2步:在主对话框中将变量选入【Variables】 ,点击【OK】 用SPSS绘制直方图 2008年8月

32 分组数据看分布—直方图 (SPSS绘制的直方图)
2008年8月

33 分组数据看分布—直方图 (直方图与条形图的区别)
条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列 条形图主要用于展示定性数据,而直方图则主要用于展示定量数据 2008年8月

34 未分组数据看分布—茎叶图 (stem-and-leaf plot)
用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留最后一位数字 6. 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据 2008年8月

35 用SPSS绘制茎叶图和箱线图 (包括直方图)
第1步:选择【Analyze】下拉菜单,并选择 【Descriptive statistics-Explore】 选项进入主对话框 第2步:在主对话框中将变量选入【Variables】, 点击【Plots】,在对话框中选择【Stem- and-leaf】(根据需要可选【Histogram】以 给出直方图)。点击【Continue】回到主对话 框。点击【OK】 用SPSS绘制茎叶图 2008年8月

36 未分组数据看分布—茎叶图 (例题分析) 第一列给出每个茎上叶子的频数 第二列是“茎”,第三列是“叶”
未分组数据看分布—茎叶图 (例题分析) 第一列给出每个茎上叶子的频数 第二列是“茎”,第三列是“叶” 下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例) SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复 2008年8月

37 未分组数据看分布—箱线图 (box plot)
用于显示未分组的原始数据的分布 箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的 中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 绘制方法 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接 2008年8月

38 未分组数据看分布—箱线图 (箱线图的构成)
X Min Q 25% 中位数 Q 75% X Max 4 6 8 10 12 Median/Quart./Range箱线图 2008年8月

39 某电脑公司销售额数据的Median/Quart./Rang箱线图
未分组数据看分布—箱线图 (例题分析) 25%四分位数 170.25 中位数 182 75%四分位数 197 最小值 141 最大值 237 某电脑公司销售额数据的Median/Quart./Rang箱线图 2008年8月

40 分布的形状与箱线图 左偏分布 对称分布 右偏分布 不同分布的箱线图 Left-skewed distribution
Bell-shaped distribution Right-skewed distribution 不同分布的箱线图 2008年8月

41 未分组数据看分布—多批数据箱线图 (例题分析)
未分组数据看分布—多批数据箱线图 (例题分析) 【例】 从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征 11名学生各科的考试成绩数据 课程名称 学生编号 1 2 3 4 5 6 7 8 9 10 11 英语 经济数学 西方经济学 市场营销学 财务管理 基础会计学 统计学 计算机应用基础 76 65 93 74 68 70 55 85 90 95 81 87 75 73 91 78 97 51 92 71 88 69 84 66 63 79 80 60 67 86 83 77 82 72 94 62 2008年8月

42 用SPSS绘制多批数据箱线图 用SPSS绘制箱线图 第1步:选择【Graphs】下拉菜单,并选择【Boxplot】
第2步:在出现的对话框中选择【Simple】,在 【Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】 返回主对话框 第3步:在主对话框将所有变量(这里是11个学生)选入 【Boxes Represent】,将“课程名称”选入 【Label Cases by】。点击【OK】 用SPSS绘制箱线图 2008年8月

43 未分组数据—多批数据箱线图 (例题分析—Median/Quart./Range)
8门课程考试成绩的箱线图 2008年8月

44 未分组数据—多批数据箱线图 (SPSS绘制的箱线图)
11名学生考试成绩的Median/Quart./Range箱线图 2008年8月

45 两个变量间的关系—二维散点图 (2D Scatterplots)
展示两个变量之间的关系 用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图 2008年8月

46 两个变量间的关系—二维散点图 (2D Scatterplots)
2008年8月

47 两个变量间的关系—重叠散点图 (用SPSS绘制重叠散点图)
如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(Overlay Scatter)(注意:绘制重叠散点图时,变量值之间的数值差异不能过大,否则不便于比较) 比如,如果想比较固定资产投资额与地区生产总值和最终消费支出的关系,可以把固定资产投资作为共同的一个坐标轴,地区生产总值和最终消费支出作为另一个坐标轴 也可以绘制散点图矩阵(Matrix Scatter) 2008年8月

48 用SPSS绘制重叠散点图 (Overlay Scatter)
第1步:选择【Graphs】下拉菜单,并选择 【Scatter/Dot】点击【Define】 第2步:将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地区生产总值”和“固定资产投资额-最终消费支出”) ,点击【OK】 用SPSS绘制重叠散点图 2008年8月

49 两个变量间的关系—重叠散点图 (Overlay Scatter)
2008年8月

50 比较多个样本的相似性 —雷达图 (radar chart)
也称为蜘蛛图(spider chart) 从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图 可用于研究多个样本之间的相似程度 2008年8月

51 多变量数据—雷达图 (例题分析) 【例】2006年我国东部、中部、西部及东北地区城镇居民的生活消费支出数据如表2—8所示。绘制雷达图,比较不同地区的消费支出构成 2008年8月

52 多变量数据—雷达图 (例题分析) 2008年8月

53 第 2 章 用图表展示数据 2.3 合理使用图表

54 鉴别图表优劣的准则 一张好的图表应包括以下基本特征 5种鉴别图表优劣的准则:一张好的图表应当 显示数据
让读者把注意力集中在图表的内容上,而不是制作图表的程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况 2008年8月

55 本章小结 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形
合理使用图表 2008年8月

56 结 束 THANKS


Download ppt "统 计 学 (第三版) 2008 作者 贾俊平 统计学."

Similar presentations


Ads by Google