資料轉換.

Slides:



Advertisements
Similar presentations
RESSET 金融研究数据库 RESSET/DB 操作指南 经济金融研究数据专业平台 北京聚源锐思数据科技有限公司.
Advertisements

实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
实习期工作总结 述职人:孙伟 —— 个人简历 姓名:孙伟 毕业院校 : 内蒙古民族大学 专业:农业机械化及其自动化.
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
中国宏观经济数据库 ( 国泰安研究服务中心 ). 一、数据库简介  “ 国泰安研究服务中心 ” ( )是 中国经济、金融、会计研究的门户网站,主要从事 股票市场、上市公司、基金市场、期货市场、债券 市场、货币市场等经济数据的采集和研究服务。  国泰安研究服务中心由数据服务、研究服务与学者.
北京师范大学生命科学学院 北京师范大学生命科学学院 余跃强 章腾勋 王航 余跃强 章腾勋 王航 2 目 录目 录目 录目 录  前言 前言  概述 概述  形态和生活史 形态和生活史  寄生适应特征 寄生适应特征  致病机制与症状 致病机制与症状  诊断 诊断  流行情况 流行情况.
建筑业2014年统计年报 和2015年定期报表培训 深圳市福田区统计局 2014年12月.
第七章 交叉分析表.
河北衡水中学 康新江 高效课堂与激情教育 河北衡水中学 康新江
RESSET 金融研究数据库RESSET/DB 操作指南
省教厅检查首批中职示范校建设情况 准备工作会议
中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
国家科技计划体系暨 国家重点新产品计划 申报简介
课程介绍 大学计算机基础 基础理论篇(讲课20学时,10周) 学习指导与实训篇(上机12学时,6周) 上机安排(9-14周)
國中教育會考 十二年國教—免試入學 及 意見整理.
護理部門實務運作與評鑑準備(一) 謝美美
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
黄岛区政府部门责任清单编制工作介绍 二〇一五年六月.
2016 营改增纳税人 增值税纳税申报表培训课件 平定县国税局 时间:2016年5月.
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
智学网账号登录 1、打开网页,在地址栏里输入 2、点击登录,输入用户名和密码,即可登录:
模块02 旅游电子商务应用实训
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
探討某醫院志工 中華醫事科技大學 參與服務動機影響因子 指導老師: 趙 海 倫 老 師 班 級: 四 醫 管 四 A
104學年度臺南區免試入學作業國中端說明會 臺南市政府教育局 104學年度臺南區高級中等學校免試入學委員會 日期:104年1月9日(五)
大学生参加城镇居民医疗保险工作流程 南京师范大学医保办制作 办公电话:
本章要學會: 1.彙整統計分析資料 2.繪製表格及圖形 3.撰寫報告
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
4.3 处理数据 宝鸡理工学校计算机组 李小保.
複選題.
新办企业办税须知 --新办企业纳税人涉税事项介绍
按病种临床路径定额 限额付费管理     柳州市人民医院医保办 2012年2月16日 .
软件工程 实验三 周志钊
电大教研活动 如何规范电大网上教学辅导 程庆峡 2010年4月 电大教研活动.
上海文会会计师事务所有限公司 中国注册会计师 童幸义
模块4 授导型教学的设计 陈冬.
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
玉溪工业财贸学校副校长 示范校建设办公室主任 柏家渭 2014年5月13日
学习方法建议 首先应该有明确的学习动机,解决思想问题。 然后根据自己实际要有一个明确的学习目标。
IC3 考試題庫 第二科:軟體(習題版).
申請土地徵收注意事項 內政部地政司 邱于蓉.
中国科学院档案数字化 工作情况介绍 潘亚男 2013年10月24日
计算机最新实用技术 基础教程.
AWM 增修功能/報表/常見錯誤說明 1 新增功能及報表 訪價轉存Excel及mail廠商報價、廠商回價Excel匯入
Moodle試用報告 林俊卿.
传媒学院2013年度团委工作 总结分析报告
第十四章 信度.
市場調查與分析 Marketing Research and Analysis
付款作業錯誤態樣【出納組】 錯誤1~核銷文件備具不齊 錯誤2 ~戶名與系統不同 錯誤3 ~未輸發票號碼日期 錯誤4 ~受款人帳號輸錯
武汉理工大学人事系统 职称评审资格审查培训
RESSET 数据库 RESSET/DB 操作指南
Word 2003 學習導引手冊 第四章 檔案存取介紹 作者 丁安強 博碩-Word 2003 學習導引手冊 Ch04.
97學年度 導師輔導知能研習營成果.
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
教 材 介 紹 靈活組合 愉快學習.
地方科技基础条件资源调查管理信息系统 (标准化器)操作培训 2017年7月 呼和浩特
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
成本会计学.
项目4.4: 工作表格式化 项目描述 能力目标 与WORD一样也对EXCEL的数据单元格设置边框和底纹,使工作表更加美观漂亮;若使用条件格式还能将符合条件的单元格数据指定格式,以便更好地比较和分析数据;设置页面布局、打印范围、打印参数将工作表打印出来。 掌握对单元格设置边框和底纹的基本操作与应用,
计 算 机 应 用 基 础 潍坊学院 计算机工程学院 主讲人:李凤慧.
安全保密产品检测申请书 材料准备介绍.
Excel 進階 By 梁志堅.
論文原創性比對系統 研究生業務承辦人使用說明 圖書館讀者組 顧若梅 校內分機2831或2843.
全國高級中等學校專業群科 食品群專題組之專題製作 經驗分享 報告者:北門農工 (劉軒如).
6 分析資料-以統計測量數呈現.
Presentation transcript:

資料轉換

自別的檔案取得資料 有很多情況,我們得自不是SPSS所產生之資料檔取得資料,轉入SPSS以進行統計分析。 例如,過去研究所蒐集之資料,在DOS時代,可能是以PE2或PE3文字編輯程式,以本文型式,存於.txt或.dat檔。也可能是以dBASE資料庫程式所儲存之.dbf資料檔。在Windows下,大部份是存於Excel的.xls活頁簿;或是以『記事本』文字編輯程式所編輯之.txt或.dat本文檔。 若想再度取得這些資料來進行分析,當然不可能要於SPSS重打一次。這樣,不僅費時費事且還可能會有打錯資料之情況!(每多一次人工參與,就會有多一次錯誤的顧慮)

即便是目前很多學校均已經提供有SPSS,很多學生還是不會考慮在學校以SPSS來輸入資料。 更主要的原因是,回家後,家裏並無SPSS,也無法進行資料輸入。所以,絕大部份之學生,以Excel進行資料輸入,再帶到學校,轉成SPSS的資料檔,進行SPSS的統計分析。

以Excel輸入資料,除了其軟體取得容易外;另外一個明顯的好處是:Excel也有很多統計分析工具。除非是碰上Excel無法解決的複雜分析,才帶到學校以SPSS分析。否則,大部份的分析,還可在家中,以Excel直接進行分析。 此外,使用Excel,於輸入中,還可以「資料(D)/驗證(L)…」控制所輸入之資料必須介於那個範圍內?於輸入後,也可以「資料(D)/篩選(F)/自動篩選(F)」進行事後篩選,以過濾出不合理之錯誤資料。

直接開啟Excel檔案 由於,Excel是目前相當普及的軟體。也是現階段,最有可能會被用來輸入問卷調查資料的工具。故底下就舉一個將Excel檔案轉為SPSS資料檔的實例。 有一點要特別提一下,於Excel進行資料鍵入工作時,第一列之內容即是將來欄變數之名稱。雖然,Excel允許使用中/英文當欄名,字數也幾乎沒限制,上限1024個字。 不過,因為要將這些資料轉到SPSS進行分析,故建議您將字數縮到8個英文或4個中文字以內。否則,將只能取用前面8個英文(4個中文)而已;但會將原過長之欄名安排到『註解』處,當變數標籤。

假定,已以Excel完成一問卷資料之輸入:(存於『未購原因.xls』) 可以下示步驟,將其轉入SPSS: 先將『未購原因.xls』關閉

於SPSS,執行「檔案(F)/開啟舊檔(O)/資料(A)…」(或按 鈕)

按『檔案類型(T)』右側之向下箭頭,選擇要開啟之檔案類型(Excel(*.xls)) 轉入適當磁碟資料匣

雙按要開啟之檔名(『未購原因xls』),或選取該檔名後按〔開啟〕鈕。若所要取用之資料,並非該檔案之第一個工作表,可於『工作單』處,按其右側向下箭頭,進行選擇。

確定已選擇「從資料第一列開始讀取變數名稱」,可將工作表第一列之內容,當成SPSS資料檔的變數名稱(若原名稱超過8個字元,將取用前面8個英文字元(4個中文)而已;但會將原欄名安排到『註解』處,當變數標籤) 按〔確定〕鈕,即可將Excel之內容轉入SPSS

馬上練習 將『手機考慮因素.xls』工作表內容,轉入SPSS。本例之欄名,有部份是超過4個中文字,如:『符合人體工學』與『附屬功能多』。

馬上練習 將『手機月費.xls』的第二個工作表『月費』內容,轉入SPSS。

以拖曳方式取得外部檔案 將外部之Excel檔案,以拖曳方式將其圖示,直接拉入SPSS『資料檢視』或『變數檢示』的任意位置。 其下有一加號,表其為複製性質。鬆開滑鼠後,將顯示: 往後之操作步驟,就與前文相同。

直接開啟本文檔案 若欲取得者,係本文型式之.txt文字檔:(便宜之排名.txt』)其內各欄內容係以空格當間隔符號。

可以下示步驟,將其轉入SPSS: 先將『便宜之排名.txt』關閉 於SPSS,執行「檔案(F)/讀取文字資料(R)」,轉入適當磁碟資料匣

雙按要開啟之檔名(『便宜之排名.txt』),或選取該檔名後按〔開啟〕鈕

於『您的文字檔符合預先定義的格式嗎?』處,選「否(O)」,按〔下一步〕鈕

於『您的變數如何排列?』處,選「分隔(D)」(本例係以空格當分隔符號);於『變數名稱包含在檔案的最上層嗎?』處,選「是(Y)」;續按〔下一步〕鈕

維持目前預設之設定:由第2筆開始、每筆一個觀察值、全部匯入,續按〔下一步〕鈕

選取所使用之分隔符號(本例為「空格(S)」),按〔下一步〕鈕(出現此警告,係因『台灣大哥大』名稱過長之故) 按〔確定〕鈕(『台灣大哥大』已被改為『台灣大哥』)

以捲動軸捲動,查一下轉換結果,看是否正確?若無誤,按〔下一步〕鈕

其上之設定均維持於「否(O)」即可,按〔完成〕鈕,將文字檔內容轉到SPSS之資料檔(僅『編號』欄需要將小數取消而已,其餘之內容均無問題)

取用表格之內容 假定,要分析之資料是公佈在網路(或Word文件)上的表格,您會考慮以何種方式將其轉入到SPSS? 較理想的作法是,以複製/貼上之技巧進行,將表格轉貼到Excel;將其存檔並關閉。然後,再以SPSS直接開啟Excel檔。

馬上練習 將『表格資料.doc』之Word表格內容,轉入SPSS。

轉存為其他軟體可用之資料 相反的情況,原為SPSS之資料檔,也可以轉存為其他軟體可用之資料。如:Excel、dBASE、Lotus、……;或文字型態的本文檔。由於,還是以轉存為Excel之活頁簿檔的情況最多。轉為Excel活頁簿檔的操作步驟: 開啟SPSS的資料庫檔(手機.sav』進行練習)

執行「檔案(F)/另存新檔(A)…」 按『存檔類型(T)』右側向下按鈕,選擇要將檔案轉存為那種類型?(本例選「Excel(*.xls)」)

於『檔案名稱(N)』處,輸入檔名

按〔儲存〕鈕,即可將其轉存成Excel之活頁簿檔

合併觀察值--利用指令 為縮短輸入資料時間,常將問卷分由幾個不同人進行輸入,於輸入結束後,再將其內容合併於一個檔案。假定,有如下兩資料檔,其變數名稱之定義、順序及個數完全相同。(可由一人建妥後,再分抄給其他幫忙輸入資料者,以確保每個人能拿到相同之定義): (資料-甲.sav』,其內有編號229~232等四筆問卷資料)

(資料-乙.sav』,其內有編號306~309等四筆問卷資料)

開啟『資料-甲.sav』(『資料-乙.sav』開啟或關閉均無所謂) 執行「資料(D)/合併檔案(G)/新增觀察值(C)…」,轉入資料匣

雙按『資料-乙. sav』之檔案圖示。右側所顯示者為『資料-乙. sav』之欄名內容,由於與『資料-甲 雙按『資料-乙.sav』之檔案圖示。右側所顯示者為『資料-乙.sav』之欄名內容,由於與『資料-甲.sav』完全相同。故左側並無任何無法配對之變數。

按〔確定〕鈕,即可將『資料-乙.sav』之所有觀察值,增添到『資料-甲.sav』之尾部

利用複製/貼上之技巧 其實,亦可以分別開啟兩檔,利用複製/貼上之技巧,將乙檔案之全部觀察值貼到甲檔案之尾部。 開啟『SPSS範例\Ch04\資料-甲.sav』 再執行一次SPSS,開啟『資料-乙.sav』,使兩檔同時開啟 按住『資料-乙.sav』之列號,以拖曳方式,將其觀察值全部選取 執行「編輯(E)/複製(C)」(或按Cttrl+C鍵),記下所選取之內容

轉到『資料-甲. sav』,點選其最底下空白列的列號按鈕,選取該列。以拖曳方式,選取與『資料-乙 轉到『資料-甲.sav』,點選其最底下空白列的列號按鈕,選取該列。以拖曳方式,選取與『資料-乙.sav』之筆數相同之列數(若不知道幾列?寧可多選幾列,等貼入後,再將多出之空白列刪除)

執行「編輯(E)/貼上(P)」(或按Cttrl+V鍵),將所記下之內容抄過來

合併變數--利用指令 若情況剛好相反,要合併之對象為變數欄(向右增加欄位內容,並非定義而已),可以「資料(D)/合併檔案(G)/新增變數(V)…」來處理。 如『手機1.sav』,其內有『問卷編號』、『有手機』與『月費』等欄:

而『手機2.sav』,其內有『問卷編號』、『大小適中』、『重量輕巧』與『顏色炫麗』等欄: 兩檔之觀察值筆數一致,且依『問卷編號』排妥順序。

擬將兩檔之欄位內容,合併成一個檔。假定,要彙集於『手機1.sav』內,其操作步驟為: 開啟『手機1.sav』(『手機2.sav』開啟或關閉均無所謂) 執行「資料(D)/合併檔案(G)/新增變數(V)…」,轉入資料匣

雙按『手機2. sav』之檔案圖示。右側為『手機1. sav』增加了『手機2 雙按『手機2.sav』之檔案圖示。右側為『手機1.sav』增加了『手機2.sav』之新變數後的結果;由於兩檔均有『問卷編號』,故將『手機2.sav』之『問卷編號』排除,並顯示於左側之方塊內。

按〔確定〕鈕,即可將『手機2.sav』內『大小適中』、『重量輕巧』與『顏色炫麗』等欄變數,合併到『手機1.sav』

利用剪貼技巧 其實,亦可分別開啟兩檔,利用複製/貼上之技巧,將乙檔案之某些欄位內容複製到甲檔案之尾部: 開啟『手機1.sav』 再執行一次SPSS,開啟『手機2.sav』,使兩檔同時開啟 按住『手機2.sav』之欄名標題,以拖曳方式,將『大小適中』、『重量輕巧』與『顏色炫麗』等三欄選取

執行「編輯(E)/複製(C)」(或按Cttrl+C鍵),記下所選取之內容 轉到『手機1.sav』,點選其最右側空白欄的欄名按鈕,選取該列。以拖曳方式,選取與同於先前所選之欄數(3欄)

執行「編輯(E)/貼上(P)」(或按Cttrl+V鍵),將所記下之內容抄過來。亦可將『手機2 執行「編輯(E)/貼上(P)」(或按Cttrl+V鍵),將所記下之內容抄過來。亦可將『手機2.sav』內『大小適中』、『重量輕巧』與『顏色炫麗』等欄變數,合併到『手機1.sav』

重新編碼 『重新編碼』係將某欄變數,依其內容進行合併,以縮減答案數。如,受訪者之月所得數字,分佈得相當凌亂,可將其縮減為『~20,000』、『20,001~40,000』、『40,001~60,000』與『60,001~』等幾組。 又如,使用A品牌者佔50%、B品牌者佔35%、C品牌者佔5%、D品牌者佔3%、E品牌者佔2%、……、K品牌者佔1%。若要將A~K品牌之次數分配全部列出,恐也太多!故可將其縮減為『A品牌』(50%)、『B品牌』(35%)與『其他品牌』(15%)三組而已。

SPSS計提供有兩種『重新編碼』: 將結果安排於同一變數 將結果安排於不同變數(本部份之實例,請參見第五章『次數分配』之說明) 前者,較為危險,萬一操作錯誤,會將原資料蓋成錯誤之結果!故通常是選擇後者,將轉換結果安排成另一個新變數;若做錯了,了不起將其刪除就是,原始資料則仍維持不變。 另一個不願將重新編碼的結果安排於同一變數之理由是,像原始所得資料係連續數值,可用來計算平均數、標準差、……等統計量。若將原數字直接轉換成分組結果,就變成是類別(組別)變數,僅能求次數,並無法計算平均數、標準差、……等統計量;且也無法拿來進行更進一步之均數檢定,那將是一大損失!

SPSS之「編輯(E)」指令,並無「取代」之功能項。若要執行該動作,就得利用「轉換(T)/重新編碼(R)/成相同變數(S)…」。 假定,『手機廠排.sav』之資料,當『有手機』欄為2時,表該受訪者並無手機,其『手機廠排』欄內之答案就應該為0,但目前該欄內存有部份資料是錯誤的。如,第2, 6, 7列,其『手機廠排』欄就有非0之資料:

可以下示步驟,找出當『有手機』欄為2時,即將其『手機廠排』欄內之答案全數替換成0: 執行「轉換(T)/重新編碼(R)/成相同變數(S)…」(若其上已有其他不相關之設定,可按〔重設〕鈕,將其全數清除)

選『手機廠牌』,按 鈕,將其送到右側之『變數(V)』方塊

按 鈕

選「包含滿足條件時的觀察值(I):」,續選『有手機』,按 鈕,將其送到右側

按 鈕及 鈕,將其條件安排為『有手機=2』,表無手機時才要進行後續之重新編碼(條件式亦可以鍵盤進行輸入)

按〔繼續〕鈕,回上層對話方塊,可發現已顯示有過濾條件:若『有手機=2』

按 鈕,左下選「全部其他值(O)」,並於右上『新值為』之「數值(L):」處輸入0,表示將全部資料改為0(當其符合『有手機=2』之條件時)

按〔繼續〕鈕,將此一設定搬到『舊值 --> 新值(D)』方塊,顯示「ELSE--> 0」(此動作經常被忘記,結果什麼更新也沒做!)

按〔繼續〕鈕,回上層對話方塊

按〔確定〕鈕結束,可找出所有符合『有手機=2』條件的觀察值,並將其『手機廠牌』資料均改為0。原第2, 6, 7列,其『手機廠排』欄已改為0。

計算 『重新編碼』只是將某值轉換成簡單之新值,並無法進行計算。若碰上得經過使用某些欄位內容進行計算,才可獲得之新內容,就得利用「轉換(T)/計算(C)…」。以『總平均.sav』為例:

擬依『國文』4學分、『英文』3學分、『數學』3學分之權數,計算其加權平均,置入另一新『平均』欄。其處理步驟為: 執行「轉換(T)/計算(C)…」

於『目標變數(T)』處,輸入欲存放運算結果之新變數名稱『平均』 點按『數值運算式(E)』下之文字方塊,將顯示出游標。即可輸入運算式。變數名稱、運算符號或數字均可以鍵盤進行輸入,當然也可按其上所提供之按鈕來輸入。要輸入變數名稱,也可於左側選妥名稱,續按 鈕,將其送到右側。本例輸入: (國文*4+英文*3+數學*3)/10 以計算加權平均:

若有過濾條件,尚可按〔若(I)…〕鈕進行設定(本例無過濾條件) 最後,按〔確定〕鈕,計算出平均成績,置入新變數『平均』欄

置換遺漏值 假定,『置換遺漏值.sav』內,有幾筆『平均月費』為未輸入任何資料之系統遺漏值(僅顯示點號,如:第2, 3, 7列之內容):

可以下示步驟,將其替換成某一特殊值: 執行「轉換(T)/置換遺漏值(V)…」

按『方法(M)』處向下箭頭,選擇要替換成何種新值?(本例選「數列平均數」) 左側選『平均月費』,按 鈕,將其送到右側『新變數(N)』下

『名稱(A)』處,自動補上之『平均月_1』即SPSS自動安排之新變數名稱。但仍允許我們自行修改,本例將其改為『月費_1』:

按 鈕,換掉舊名稱

按〔確定〕鈕,產生新變數『月費_1』,其內已將原系統遺漏值,均改為平均值291(第2, 3, 7列)