第十一章 多变量的可视化分析 第一节 引言 第二节 折线图分析法 第三节 条形图分析法 第四节 散点图分析法 第五节 雷达图分析法

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
數學社群 教學分享 和平國小 陳淑渟老師 數學社群 教學分享 和平國小 陳淑渟老師. 小一常發生的 學習困難 定位板的應用 序數的學習 困難與教學 突破 主題大綱.
健康.安全年 製作 : 黃靜怡. 安全第一,我想,這是一句大家都耳熟能詳的話吧,說安全, 簡單的說,就是注意自己、眼睛要看、耳朵要聽,不要莽莽 撞撞的,安全是大家所期望的,而父母總是常常掛念我們, 就是希望我們能安全,畢竟,孩子是父母一輩子的牽掛,會 擔心我們的,往往就是關心我們的人,每個人都希望自己做.
【大願文教基金會】園藝治療師 黃盛璘督導、王麗玲執行. 年齡在 2 足歲以上 18 歲以下,經醫學中 心或區域醫 院鑑定為 重度、極重度 身心障礙,不具行動能 力、且不能自理生活,並持有身心障礙 手冊的新北市居民。 八里愛心教養院~服務對象.
第二十九课 致儿子书 张之洞.
如何陪伴孩子度過 高三歲月.
中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
把人的生命写在教育的旗帜上 了解一个案件 欣赏一篇散文 学习一种理念 感悟一个故事.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
六大原因造成 現代人身體酸性化.
國中教育會考 十二年國教—免試入學 及 意見整理.
【2008年高考重庆卷】A.当冰雪皑皑之际,唯独梅花昂然绽放于枝头,对生命充满希望和自信,教人精神为之一振。
第六章 统计表与统计图 第一节 统计表 第二节 统计图 1.
景区讲解常用方法.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
班級愛心小護士訓練 臺南市東區勝利國小 健康中心.
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
项目四 营业税 山东经贸职业学院 财政金融系.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
敬业·创业·乐业 ——我的成长之路 赵谦翔.
四年七班親師會 自信學習,健康成長.
探討某醫院志工 中華醫事科技大學 參與服務動機影響因子 指導老師: 趙 海 倫 老 師 班 級: 四 醫 管 四 A
醫療旅遊.
社會發展學系 簡 介.
人物小传:杨嘉嵋,1975年出生,国家 重点四川大学本科毕业,中国传媒大学博士毕业,现为上海政法学院讲师。多次发表学术论文:《试论社会主义法治的目标和现代法治精神的培育》发表于钦州师范高等专科学校校报2000年04期,《西部在引进,利用外资中应重视的问题及对策》发表于四川师范学院学报2000年05期,《试论毛泽东的刑法思想》发表于达县师范高等专科学校学报2001年01期,《美国著名主持人的十点共性》发表于中国广播电视学刊2007年08期,《我国电视法治节目的现状与提升》发表于新闻战线2008年08期。
第二章 语用的主要要素分析 第一节 语境 第二节 预设 第三节 角色 第四节 视角.
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
从从容容中考去.
美麗的星空 陳弦希製作.
性別刻板印象.
初三8班(上) 期末总结班会.
初三(上) 期末总结班会.
“三项制度+一个平台”构建 省级高校教学质量监控体系
一週菜單設計.
瓯海职专财经专业组简介.
改革开放给我们带来的变化 系别:11商务流通系 班级:物流四班 组员:物四男生组.
国有资产清查 数据填报操作规范 2016年3月25日.
大村國小 尋根之旅.
那年我參加瑞士巴塞爾博覽會, 除了接單做貿易,還零售賣品, 以擴大出口商品的影響。
西安国际港务区 入区企业相关地方税收 知识培训
如何使用 Excel 與SPSS繪製 統計圖型
上海文会会计师事务所有限公司 中国注册会计师 童幸义
親職學習多面體 中學篇 第四課 管教之道 (二) 1 1.
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
仓储企业岗位人员招聘 第一组 组员 :陈娇娇 祝婷婷 丁元莉 袁珮 王慧.
医学统计学 主讲人:信息部 林雪君.
人口与计划生育 统计分析 昌吉市计划生育委员会 二○○六年三月.
2014年深圳市学生人身意外伤害保险投保工作介绍 中国人民财产保险股份有限公司深圳市分公司
传媒学院2013年度团委工作 总结分析报告
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
科 展 說 明.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
成本会计学.
舊生升級編班與新生管理操作說明 全誼資訊股份有限公司 中華民國106年06月05日.
補救教學實施方案 科技化評量系統操作說明 對象:綜合權限 1 1.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
群聚分析操作介紹 -以SOM和K-means為例
新课程理念下如何进行课堂教学 刘志超 2014年2月25日.
Statistical Table and Statistical Graph
6 分析資料-以統計測量數呈現.
Presentation transcript:

第十一章 多变量的可视化分析 第一节 引言 第二节 折线图分析法 第三节 条形图分析法 第四节 散点图分析法 第五节 雷达图分析法 第一节 引言 第二节 折线图分析法 第三节 条形图分析法 第四节 散点图分析法 第五节 雷达图分析法 第六节 星座图分析法

第一节 引言 众所周知,图形是我们直观了解、认识数据的一种可视化手段。如果能将所研究的数据直接显示在一个平面图上,便可以一目了然地看出分析变量间的数量关系。直方图、散点图等就是我们常用的二维平面图示方法。虽然三维数据也可以用三维图形来表示,但观测三维数据却存在一定的难度,而且在许多实际问题中,多变量数据的维数通常又都大于3,那么如何用图形直观表现三维以上的数据呢?自上世纪70年代以来,多变量数据的可视化分析研究就一直是人们关注的一个问题。

从研究的成果来看,主要可以分为两类: 一类是使高维空间的点与平面上的某种图形对应,这种图形能反映高维数据的某些特点或数据间的某些关系; 另一类是对多变量数据进行降维处理,在尽可能多地保留原始信息的原则下,将数据的维数降为2维或1维,然后再在平面上表示。例如前面介绍的主成分分析方法、因子分析方法、多维尺度法等就属于此类方法。这里仅介绍5种实用而有效的多变量可视化方法。

表11.1是我国华北地区5个省市2003年城镇居民家庭平均每人全年消费性支出的六项指标数据,下面分别用5种可视化方法对数据进行分析。 考虑微机的普及应用,本章主要介绍5种图形的制作方法,图形的制作则通过电脑实现。折线图、条形图、矩阵散点图在SPSS中制作,雷达图和星座图则在EXCEL中实现。 表11.1 华北5省市城镇居民家庭消费性支出

第二节 折线图分析法 折线图是将多个样品观测数据以折线的方式表示在平面图中的一种多变量可视化图形。折线图用线段的升降来表示变量的大小,常用于表示现象在时间上的变化趋势、现象的分配情况和两个现象之间的依存关系等。 折线图的作图原理如下: (1)作平面坐标系,横坐标取p个点,表示p个变量,纵坐 标表示变量取值。 (2)对给定的样品观测值,在p个点的纵坐标上标出相应的 变量取值。 (3)将表示p个变量取值的点连接成一条折线,即得到了表 示一个样品观测数据的折线,n次观测可绘出n条折 线,构成多变量折线图。

在SPSS中作折线图的方法如下: (1)将原始数据输入SPSS中。注意数据的组织形式要像图11.1那样。即把不同地区当成变量,而把支出指标当成观测。 图11.1 作折线图时的数据组织形式

(2)选择菜单项Graphs→Line,打开Line Charts对话框,如图11 (2)选择菜单项Graphs→Line,打开Line Charts对话框,如图11.2。在对话框上方的三个选项用于选择折线图的形式,由于是这里是多变量作图,所以选择Multiple。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Multiple Line对话框。 图11.2 Line Charts对话框

(3)在Define Multiple Line对话框中,将代表不同地区的5个变量移入Lines Represent列表框中,将代表支出指标的变量(variable)移入Variable框中。单击OK按钮,即可作出如图11.4所示的折线图。从图中可以清楚地看出北京市几乎各项支出都排在第一,而山西省则几乎每项支出都是最低的。 图11.3 Define Multiple Line对话框

图11.4 折线图

第三节 条形图分析法 条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。 第三节 条形图分析法 条形图是由若干平行条状的矩形所构成,而以每一个矩形的高度来代表数值的大小。 按图11.1所示的方式在SPSS中组织好数据后,条形图的制作步骤如下: (1)选择菜单项Graphs→Line,打开Bar Charts对话框,该对话框与图11.2所示的Line Charts对话框有相同的选项。在对话框上方的三个选项用于选择条形图的形式,由于是这里是多变量作图,所以选择Clustered。在对话框下面的三个选项中选择Value of individual cases。单击Define按钮,打开Define Clustered Bar对话框。 (2)在Define Clustered Bar对话框中,将代表不同地区的5个变量移入Bars Represent列表框中,将代表支出指标的变量移入Variable框中。单击OK按钮,即可作出如图11.5所示的条形图。

图11.5 条形图

可以发现,折线图和条行图的作图过程几乎相同,作图原理也大同小异,折线图是以折线的高低来表示变量的大小,条形图是以矩形的高低来表示变量的大小。 从图11.5也可以得出与折线图同样的结论:北京市各项支出都比较高,而山西省各项支出都比较低。

第四节 散点图分析法 散点图又称散布图,它是以点的分布反映变量之间相关关系的可视化方法。矩阵散点图则是一种反映多个变量之间相关关系的二维散点图。 利用SPSS制作矩阵散点图的步骤如下: (1)在SPSS中按图11.6的形式组织数据,即把支出指标当成变量,而把不同地区当成观测。 图11.6 作散点图时的数据组织形式

(2)选择菜单项Graphs→Scatter,打开Scatter plot对话框,如图11 (2)选择菜单项Graphs→Scatter,打开Scatter plot对话框,如图11.7。该对话框用于选择散点图的形式。选定Matrix,即矩阵散点图 ,单击Define按钮,打开Scatter plot Matrix对话框,如图11.8。 图11.7 Scatter plot对话框

图11.8 Scatter plot Matrix对话框

(3)在打开的Scatter plot Matrix对话框中,将食品、衣着、居住三个变量移入Matrix Variables列表框中,将标志变量region移入Label Cases by列表框中。 (4)点击OK按钮,得到如图11.9所示的矩阵散点图。 从图11.9可以看出,河北、山西、内蒙古在居住和食品消费支出方面与北京、天津相比较低,食品与居住支出变量之间存在一定的线性关系。天津在衣着支出方面较低,与最低的河北接近,与最高居住支出形成鲜明对比。北京则除在居住支出方面低于天津外,其他方面支出均高于华北其他省市。内蒙古则在衣着支出方面仅次于北京,显示出某种特殊消费特征。

图11.9 矩阵散点图

另外,还可以作三维立体散点图。只需在Scatter plot对话框(图11 另外,还可以作三维立体散点图。只需在Scatter plot对话框(图11.7)中选择3-D选项。在跳出的3-D Scatter plot对话框中将食品、衣着、居住三个变量分别移入X Axis、Y Axis和Z Axis列表框中,将标志变量region移入Label Cases by列表框中。单击OK按钮,则作出图11.10所示的三维立体散点图。 矩阵散点图不仅可以在二维平面上同时反映多个变量数值,而且可以用于直观反映多个变量间是否存在某种关系。与三维立体图相比,有着更好的可视性。比较图11.9与图11.10不难看出这一点。

图11.10 三维立体散点图

第五节 雷达图分析法 雷达图是一种较为常用的多变量可视化图形。在雷达图中,每个变量都有它自己的数值轴,每个数值轴都是从中心向外辐射。由于图形就好像雷达荧光屏上的图像,故称其为雷达图。又像蜘蛛网,所以也称蛛网图。 雷达图的作图方法: (1)作一圆,并按变量的个数p将圆周分成p等分。 (2)连接圆心和各分点,将这p条半径连线依次定义为各变量的坐标轴,并标以适当的刻度。 (3)对给定的一次观测值,将每个变量值分别标在相应的坐标轴上,把p个点相连就形成了一个p边形,n次观测值就可画出n个p边形。

例如,根据表11. 1中的数据,调用EXCEL图表向导,选择雷达图,然后按图表向导提示,即可制作出如图11. 11~17所示的雷达图。图11 为了加强雷达图的效果,在雷达图中适当的分配坐标轴是很重要的,具体的分配办法要结合分析的问题而定。例如可将要对比的指标分布在左、右或上、下方,以便于对比分析。

当观测次数n较大和指标较多时,画出的雷达图线段太多,图形的效果会很差。为了获得较好的可视化效果,在一张雷达图上可以画几个样品观测数据,甚至一张雷达图只画一个样品观测数据。如图11.11~11.17所示,对这些图进行比较分析,也可了解其特点。 图11.11

图11.12

图11.13

图11.14

图11.15

图11.16

图11.17

第六节 星座图分析法 星座图是将高维空间的样本点投影到平面上的一个半圆内,用投影点表示样本点的多元图示方法。由于样本点在半圆内的投影犹如浩瀚苍穹中的星座,因此而称其为星座图。 星座图的作图方法: (1)通过对观测数据Xij作极差标准化变换,将其变换为角度 { ij}:

最后,利用EXCEL中的散点图制作功能可得如图11.18所示的星座图。 图11.18 星座图

本章结束