统 计 学 (第三版) 2008 作者 贾俊平 统计学.

Slides:



Advertisements
Similar presentations
第 3 章 统计整理 统计学. 【学习目标】 1. 理解统计整理的作用、原则及分类; 2. 掌握分配数列的分类及其编制方法; 3. 掌握统计图表的绘制方法。 第3章第3章.
Advertisements

中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
第二章 SPSS的基本操作 2-1 SPSS 的簡介 2-2 SPSS 軟體的功能表介紹 2-3 資料的輸入 2-4 資料的分析與輸出結果
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
13_01 Excel簡介與基本畫面 13_01_01 簡介 微軟公司的Excel軟體整合了試算表、商業統計圖表、資料庫管理等功能,除了可以做一般的計算工作外,另外還有許多內建函數,可以協助進行財務、統計、工程、管理科學上的分析與計算。
第六章 统计表与统计图 第一节 统计表 第二节 统计图 1.
SPSS系统教程.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
第五讲 非参数统计分析 吴成秋 南华大学公共卫生学院
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第二章 食品质量管理的工 具与方法.
和码汉字字形技术 和码汉字字形学习法 和码汉字字形输入法.
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法
生物醫學統計學.
第十一章 多变量的可视化分析 第一节 引言 第二节 折线图分析法 第三节 条形图分析法 第四节 散点图分析法 第五节 雷达图分析法
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
複選題.
广告原理与策划 ——主编 魏超.
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
DOE & EXCEL, SPSS application
統計學 郭信霖 許淑卿.
如何使用 Excel 與SPSS繪製 統計圖型
统计学Statistics 主讲人:商学院 刘后平 教授
医学统计学 主讲人:信息部 林雪君.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第十七章 SPSS系统在传播学研究中的应用
第四章 單變量描述性分析 第一節 描述性統計原理 第二節 報告(Reports)
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 5 章 樣本資料的數值分布.
3.2 Tally Table:將資料分成等距離的組別,再
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
敘述統計-資料的特性 Properties of Variable
Chapter 2 頻率分配.
统计软件应用 7 主讲人 陶育纯 SPSS统计分析 统计软件应用 7 主讲人 陶育纯 教案.
第六章 因子分分析 §6.1 因子分析的基本理论 §6.2 因子载荷的求解 §6.3 因子分析的步骤与逻辑框图 §6.4 因子分析的上机实现
第一章 敘述統計學.
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
第八章 科研资料的整理与分析.
圖表製作 集中指標 0628 統計學.
Tel: 第11章 SPSS在时间序列预测中的应用 周早弘 旅游与城市管理学院
第四章 SPSS的基本统计分析.
第 2 章 敘述統計:表格與圖形法.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
網路遊戲版 幸福農場168號.
資料整理與次數分配 Organizing Data 社會統計(上) ©蘇國賢2000.
EXCEL+ORIGN+SPSS的描述统计
資料整理與次數分配 Organizing Data 社會統計(上).
介绍: 1、主成分分析与因子分析的概念 2、主成分分析与因子分析的过程
個人申請系統 通過第一階段倍率篩選評估系統.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
第7章 基本统计分析 2019/5/14.
第二章 次數分配表與統計圖 第一節 次數分配表的製作 第二節 統計圖的製作 第三節 次數分配的形狀和性質 第四節 電腦習作.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
分类变量资料的统计推断.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
Excel 2010电子 表格制作案例教程.
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
群聚分析操作介紹 -以SOM和K-means為例
學生通訊錄 Excel 試算表的基本操作 06 「通訊錄」是群體中進行聯 絡、互通訊息很重要的資料。 製作一份精美且資訊豐富詳 實的通訊錄,對於 Excel 來 說是一件適合的作品。
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
安徽财经大学 计量经济学 Econometrics 经济学院 马成文
Statistical Table and Statistical Graph
Word 2010 文書處理技巧 圖資中心資訊組 李訓榮.
Presentation transcript:

统 计 学 (第三版) 2008 作者 贾俊平 统计学

图并没有说谎,是说谎者在画图。 ——Benjamin Disraeli 统计名言 图并没有说谎,是说谎者在画图。 ——Benjamin Disraeli 2008年8月

2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表 第 2 章 用图表展示数据 2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表

学习目标 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形 合理使用图表 2008年8月

男学生更容易逃课吗? 读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生每周平均逃课次数的汇总表如下 2008年8月

男学生更容易逃课吗? 逃课情况 男 女 合计 几乎一次不逃 28 49 77 1到3次 24 31 55 3到5次 6 4 10 5次以上 其他 1 2 62 89 151 你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你选择使用呢? 2008年8月

第 2 章 用图表展示数据 2.1 用图表展示定性数据 2.1.1 生成频数分布表 2.1.2 定性数据的图示

2.1 用图表展示定性数据 2.1.1 生成频数分布表

  生成频数分布表 (定性数据) 1. 列出各类别 3. 生成频数分布表 2. 计算各类别的频数 2008年8月 分类 频数 比例 1. 列出各类别   2. 计算各类别的频数 3. 生成频数分布表 分类 频数 比例 百分比 比率 A B C D E 2008年8月

生成频数分布表 (定性数据) 用Excel制作频数分布表 【例】一家市场调查公司为研究不同类型饮料的市场占有率,对随机抽取的一家超市进行调查。下面的表是调查员随机观察的50名顾客购买的饮料类型记录。生成一张频数分布表,观察不同类型饮料的销售分布状况 用Excel制作频数分布表 2008年8月

使用Excel数据透视表数计数 (pivot table) 第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域 第4步:在【向导—3步骤之3】中选择数据透视表的输出位置 。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将“分类变量“(这里 是饮料品牌)连续拖放两次:一次拖至左边的“行”区域 ,一次拖至 “数据”区域 第6步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表 用数据透视表产生定性数据的频数分布 2008年8月

生成频数分布表 (定性数据) 不同类型饮料的频数分布 2008年8月

定性数据的描述统计量 频数(frequency) :落在各类别中的数据个数 比例(proportion) :某一类别数据个数占全部数据个数的比值 百分比(percentage) :将对比的基数作为100而计算的比值 比率(ratio) :不同类别数值个数的比值 2008年8月

2.1 用图表展示定性数据 2.1.2 定性数据的图示

条形图 (bar Chart) 用宽度相同的条形的高度或长短来表示各类别数据 各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(column chart) 2008年8月

帕累托图 (pareto chart) 按各类别数据出现的频数多少排序后绘制的柱形图 用于展示分类数据的分布 2008年8月

饼图 (pie Chart) 用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例 用于研究结构问题 2008年8月

环形图 (doughnut chart) 环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示 与饼图类似,但又有区别 饼图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环 用于结构比较研究 2008年8月

环形图 (doughnut chart) 【例】2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成 2008年8月

环形图 (doughnut chart ) 北京、上海和天津地区按收入法计算的地区生产总值 2008年8月

第 2 章 用图表展示数据 2.2 用图表展示定量数据 2.2.1 生成频数分布表 2.2.2 定量数据的图示

2.1 用图表展示定性数据 2.2.1 生成频数分布表

生成频数分布表 (例题分析) 【例】某电脑公司2008年前4个月各天的销售量数据(单位:台)。生成一张频数分布表观察销售额分布的特征 2008年8月

生成频数分布表 (例题分析) 确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K 15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 例如,本例最大值为237,最小值为141,组距=(237-141)÷10=9.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足a<xb(上限值不在内 2008年8月

分组中的几个概念 1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值 下限值+上限值 2 组中值 = 用Excel制作频数分布 2008年8月

生成频数分布表 (例题分析) 某电脑公司销售额的频数分布 2008年8月

生成频数分布表 (例题分析—使用开口组) 2008年8月

使用Excel频数函数 (FREQUENCY) 选择与接受区域相临近的单元格区域,作为频数分布表输出的区域 选择统计函数中的【FREQUENCY】函数 在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域 同时按下“ctrl-shift-Enter”组合键,即得到频数分布 统计函数—FREQUENCY 2008年8月

2.1 用图表展示定性数据 2.2.2 定量数据的图示 Excel

分组数据看分布—直方图 (histogram) 用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1 用Excel制作直方图 2008年8月

用SPSS绘制直方图 第1步:选择【Graphs】下拉菜单,并选择 【histogram】选项进入主对话框 第2步:在主对话框中将变量选入【Variables】 ,点击【OK】 用SPSS绘制直方图 2008年8月

分组数据看分布—直方图 (SPSS绘制的直方图) 2008年8月

分组数据看分布—直方图 (直方图与条形图的区别) 条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列 条形图主要用于展示定性数据,而直方图则主要用于展示定量数据 2008年8月

未分组数据看分布—茎叶图 (stem-and-leaf plot) 用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留最后一位数字 6. 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据 2008年8月

用SPSS绘制茎叶图和箱线图 (包括直方图) 第1步:选择【Analyze】下拉菜单,并选择 【Descriptive statistics-Explore】 选项进入主对话框 第2步:在主对话框中将变量选入【Variables】, 点击【Plots】,在对话框中选择【Stem- and-leaf】(根据需要可选【Histogram】以 给出直方图)。点击【Continue】回到主对话 框。点击【OK】 用SPSS绘制茎叶图 2008年8月

未分组数据看分布—茎叶图 (例题分析) 第一列给出每个茎上叶子的频数 第二列是“茎”,第三列是“叶” 未分组数据看分布—茎叶图 (例题分析) 第一列给出每个茎上叶子的频数 第二列是“茎”,第三列是“叶” 下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例) SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复 2008年8月

未分组数据看分布—箱线图 (box plot) 用于显示未分组的原始数据的分布 箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这5个值绘制而成的 中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 绘制方法 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接 2008年8月

未分组数据看分布—箱线图 (箱线图的构成) X Min Q 25% 中位数 Q 75% X Max 4 6 8 10 12 Median/Quart./Range箱线图 2008年8月

某电脑公司销售额数据的Median/Quart./Rang箱线图 未分组数据看分布—箱线图 (例题分析) 25%四分位数 170.25 中位数 182 75%四分位数 197 最小值 141 最大值 237 140 150 160 170 180 190 200 210 220 230 240 某电脑公司销售额数据的Median/Quart./Rang箱线图 2008年8月

分布的形状与箱线图 左偏分布 对称分布 右偏分布 不同分布的箱线图 Left-skewed distribution Bell-shaped distribution Right-skewed distribution 不同分布的箱线图 2008年8月

未分组数据看分布—多批数据箱线图 (例题分析) 未分组数据看分布—多批数据箱线图 (例题分析) 【例】 从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征 11名学生各科的考试成绩数据 课程名称 学生编号 1 2 3 4 5 6 7 8 9 10 11 英语 经济数学 西方经济学 市场营销学 财务管理 基础会计学 统计学 计算机应用基础 76 65 93 74 68 70 55 85 90 95 81 87 75 73 91 78 97 51 92 71 88 69 84 66 63 79 80 60 67 86 83 77 82 72 94 62 2008年8月

用SPSS绘制多批数据箱线图 用SPSS绘制箱线图 第1步:选择【Graphs】下拉菜单,并选择【Boxplot】 第2步:在出现的对话框中选择【Simple】,在 【Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】 返回主对话框 第3步:在主对话框将所有变量(这里是11个学生)选入 【Boxes Represent】,将“课程名称”选入 【Label Cases by】。点击【OK】 用SPSS绘制箱线图 2008年8月

未分组数据—多批数据箱线图 (例题分析—Median/Quart./Range) 8门课程考试成绩的箱线图 2008年8月

未分组数据—多批数据箱线图 (SPSS绘制的箱线图) 11名学生考试成绩的Median/Quart./Range箱线图 2008年8月

两个变量间的关系—二维散点图 (2D Scatterplots) 展示两个变量之间的关系 用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图 2008年8月

两个变量间的关系—二维散点图 (2D Scatterplots) 2008年8月

两个变量间的关系—重叠散点图 (用SPSS绘制重叠散点图) 如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(Overlay Scatter)(注意:绘制重叠散点图时,变量值之间的数值差异不能过大,否则不便于比较) 比如,如果想比较固定资产投资额与地区生产总值和最终消费支出的关系,可以把固定资产投资作为共同的一个坐标轴,地区生产总值和最终消费支出作为另一个坐标轴 也可以绘制散点图矩阵(Matrix Scatter) 2008年8月

用SPSS绘制重叠散点图 (Overlay Scatter) 第1步:选择【Graphs】下拉菜单,并选择 【Scatter/Dot】点击【Define】 第2步:将所要配对的数据依次选入【Y-X Pairs】(本例为“固定资产投资额-地区生产总值”和“固定资产投资额-最终消费支出”) ,点击【OK】 用SPSS绘制重叠散点图 2008年8月

两个变量间的关系—重叠散点图 (Overlay Scatter) 2008年8月

比较多个样本的相似性 —雷达图 (radar chart) 也称为蜘蛛图(spider chart) 从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图 可用于研究多个样本之间的相似程度 2008年8月

多变量数据—雷达图 (例题分析) 【例】2006年我国东部、中部、西部及东北地区城镇居民的生活消费支出数据如表2—8所示。绘制雷达图,比较不同地区的消费支出构成 2008年8月

多变量数据—雷达图 (例题分析) 2008年8月

第 2 章 用图表展示数据 2.3 合理使用图表

鉴别图表优劣的准则 一张好的图表应包括以下基本特征 5种鉴别图表优劣的准则:一张好的图表应当 显示数据 让读者把注意力集中在图表的内容上,而不是制作图表的程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况 2008年8月

本章小结 定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形 合理使用图表 2008年8月

结 束 THANKS