第二章 数据的管理 2015.9.29.

Slides:



Advertisements
Similar presentations
办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
Advertisements

庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
实习四 遥感图像分类 滁州学院国土信息工程系. 背景知识 图像分类就是基于图像像元的数据文件值,将像元归并成有限几种 类型、等级或数据集的过程。常规计算机图像分类主要有两种方法:非 监督分类与监督分类,本实验将依次介绍这两种分类方法。 非监督分类运用 ISODATA ( Iterative Self-Organizing.
魏 饴. 处级干部培训班讲座 一、卓越干部的德行素质  常修为政之德、常思贪欲之害、常怀律己之心!  孔老夫子有个观点 “ 为政以德,譬如北辰居其所而众星拱之。 ”  司马光《资治通鉴》 “ 才者,德之资也;德者,才之帅也。 ” “ 德 ” 胜 “ 才 ” 谓之 “ 君子 ” , “ 才 ”
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
第二章 SPSS的基本操作 2-1 SPSS 的簡介 2-2 SPSS 軟體的功能表介紹 2-3 資料的輸入 2-4 資料的分析與輸出結果
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
SPSS系统教程.
浙江省深化高校考试招生制度综合改革试点方案(2017新方案)
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
第五讲 非参数统计分析 吴成秋 南华大学公共卫生学院
多元统计分析 何晓群 中国人民大学出版社 2017/3/4 中国人民大学六西格玛质量管理研究中心.
我征服了黃山 林達的黃山之旅 2006春.
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
传播学研究:理论与方法 戴元光 赵士林 邢虹文.
我在哈佛、麥肯錫 學到的一流工作術 富坂美織◎著.
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
摇摆的中东地区 永嘉县实验中学 张 杰.
摇摆的中东地区 永嘉县实验中学 张 杰.
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
财务管理.
第1讲 SPSS基础
广告原理与策划 ——主编 魏超.
交通事故處置 當事人責任與損害賠償 屏東縣政府警察局交通隊.
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
DOE & EXCEL, SPSS application
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
政府扶持资金通览 技术改造篇.
Oracle数据库 Oracle 子程序.
負責同仁:許慧楨小姐 系辦公室6號櫃臺 學務/獎助學金 負責同仁:許慧楨小姐 系辦公室6號櫃臺
XI. Hilbert Huang Transform (HHT)
本科生医保资料的提交.
第四章 單變量描述性分析 第一節 描述性統計原理 第二節 報告(Reports)
Hadoop I/O By ShiChaojie.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
第五讲 数据的分组、合并与转换.
第七章 SPSS的非参数检验.
統計圖表的製作.
Tel: 第11章 SPSS在时间序列预测中的应用 周早弘 旅游与城市管理学院
SPSS-概述與資料處理 輔大統計資訊系 黃孝雲.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
课 堂 练 习.
《结构力学认知实验》(授课形式)的上课时间改为: 5月5日(周二)晚上18:00~19:30和19:30~21:00,
《结构力学认知实验》(授课形式)的上课时间改为: 5月7日(周四)晚上18:30~20:00和20:00~21:30,
第二章 主成分分析 §2.1 主成分分析的基本思想与理论 §2.2 主成分分析的上机实现 2019/4/23 1
Lightweight Data-flow Analysis for Execution-driven Constraint Solving
畢業資格審查系統 操作步驟說明.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
VC++程序调试演示 An Overview of ICU 19th International Unicode Conference
新制退休實務計算說明- 現職人員退休範例說明
第八章 均值比较与检验 2019/5/10.
國金期末報告 股價指數與匯率之間的動態關係: 以台灣、日本、韓國為例 授課老師:楊奕農 學生:郭俊旻.
唐常杰 四川大学计算机学院 计算机科学技术系
第7章 基本统计分析 2019/5/14.
统计软件应用 2 主讲人 陶育纯 SPSS 统计软件应用 2 主讲人 陶育纯 教案.
数数据的基本操作 电子工业出版社.
符号 目录 页 绝对寻址和符号寻址… 符号寻址- 概述… 打开符号表 编辑:查找和替换…… 查看:过滤器 … 查看:排序…… 符号表:导出
106 學年度新生入學說明會 國立臺灣海洋大學 教務處簡介
學士學位畢業論文說明 逢 學 大 甲 土 理 管 地 2009/10/05.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
Logistic回归 Logistic regression 研究生《医学统计学》.
高雄市97年度國民小學閱讀計畫創新教學-教案達人創新教學方案
認識 Excel 與SPSS.
数据处理过程中的质量控制 寇长贵(副教授) Tel: Mail:
熟悉VC++开发环境.
Presentation transcript:

第二章 数据的管理 2015.9.29

数据管理的内容 原始变量计算出新变量 数据显示方式的变化如排序 改变变量编码的方式 分析一部分数据 合并文件 ……

1. Case summaries 程序 列出所有或部分数据 允许列出整个文件的清单或者文件中一个子集的清单 Step by step: Analyze---reports----case summaries Variables:被选中的全部值或者子集的变量清单 Grouping variables:根据某一变量创建所有其他变量列出的顺序 Display cases:默认选择 Limit cases to first:默认的初始case数目为100 Show only valid cases: 保证了列出的变量中的case都是有效的。一般不选 Show case numbers:

2. 缺失值替换 存在缺失值的case在进一步的分析中会被忽略 称名、顺序类数据有缺失值:如种族或收入等级,增加变量的水平,用该水平的数值替代缺失值。——用户定义的缺失值 连续型数据有缺失值:所有其他被试的平均或者中数。注:超过15%的值缺失须得剔除该被试或该变量 创建回归方程

Step by step: transform---replace missing values method:五种不同的替换缺失值的方法 注:numeric型数据 series mean:所有数据的均值 Mean of nearby points: 周围数据的均值,指定span of nearby points的number Median of nearby points:周围数据的中位数 Linear interpolation: 线性插值法 Linear trend at point: 线性趋势

3. Compute 创建和计算新变量 Step by step: transform ---- compute Target variable: 新变量名(注意命名的合法性) Numeric expression: 输入公式:使用计算器键盘,如建立一个新变量‘total’为测验一到期末测验成绩的总和 使用function group:将GPA分数开根号 计算:100*总和/125,并且四舍五入为整数,变量名为’percent’

4. Recode into different variables: 变量数据的重新编码 将一个已经存在的变量重新分类再编码为新变量,如成绩的重新编码 Step by step:  transform---recode---into different variables numeric variable-output variable: 原来变量转换成新变量 Old and new values:具体值或范围的转换设置 例:将percent 从高到低转换成ABCDE四个等级(十分一个等级,E为60分以下),新变量名‘gradescore’ 将percent 转换成及格与不及格两类,新变量名为‘及格情况’

将一个已经存在的变量重新编码替换原来数据,如将性别和分数等级重新编码 Step by step: transform---recode---into same variables numeric variables: 想要重新编码的旧变量 old and new values: old value:…. 注意:重新编码后value值的改变

5. Select cases选择个案 根据一定条件只选择数据集中的一个子集进行分析 Step by step: data---select cases---if condition is satisfied---… (注:变量需要是numeric) 相关语句条件示例: gender=1 year>=3 year>=2&year<=3 year=1|year=4 要恢复所有数据集:all cases

6. Sort cases排序 Step by step: data---sort cases 如,按照姓的拼音来排名: ascending;descending 姓相同时如何排列?

7.Merging files合并数据 前提: 使用相同的数据编辑器(SPSS) 每个变量的格式和设置相同 保证相匹配的变量有相同的变量名 增加新变量,保证case的排列顺序相同 增加新case,保证变量的排列顺序是相同的

增加新的case或者被试 Step by step data---merge files---add cases Unpaired variables: 不匹配的变量,*(来自原始文件),+(来自外部文件) 合并时删除匹配的变量:将变量选出variables in the new active dataset 合并时增加不匹配的变量:将unpaired variables 选入右边框中。 (注:默认不匹配的变量不会出现在合并文件中)

增加新的变量 Step by step data--- merge files—add variables excluded variables: 相同的变量 + New working data file: 原始文件中有而外部文件中没有的变量 * 增加的新变量 +

练习 使用grades.sav文件,列出变量id到quiz5的所有被试数据(按原始顺序排列),并列出case编号。 使用grades.save文件,删除quiz1的成绩,用其他人quiz1成绩的均值来替换这些缺失值。 重新编码及格情况,成绩等级为D和E的编码为不及格,ABC编码为及格 将所有被试按照id升序排列