Presentation is loading. Please wait.

Presentation is loading. Please wait.

資料轉換.

Similar presentations


Presentation on theme: "資料轉換."— Presentation transcript:

1 資料轉換

2 自別的檔案取得資料 有很多情況,我們得自不是SPSS所產生之資料檔取得資料,轉入SPSS以進行統計分析。
例如,過去研究所蒐集之資料,在DOS時代,可能是以PE2或PE3文字編輯程式,以本文型式,存於.txt或.dat檔。也可能是以dBASE資料庫程式所儲存之.dbf資料檔。在Windows下,大部份是存於Excel的.xls活頁簿;或是以『記事本』文字編輯程式所編輯之.txt或.dat本文檔。 若想再度取得這些資料來進行分析,當然不可能要於SPSS重打一次。這樣,不僅費時費事且還可能會有打錯資料之情況!(每多一次人工參與,就會有多一次錯誤的顧慮)

3 即便是目前很多學校均已經提供有SPSS,很多學生還是不會考慮在學校以SPSS來輸入資料。
更主要的原因是,回家後,家裏並無SPSS,也無法進行資料輸入。所以,絕大部份之學生,以Excel進行資料輸入,再帶到學校,轉成SPSS的資料檔,進行SPSS的統計分析。

4 以Excel輸入資料,除了其軟體取得容易外;另外一個明顯的好處是:Excel也有很多統計分析工具。除非是碰上Excel無法解決的複雜分析,才帶到學校以SPSS分析。否則,大部份的分析,還可在家中,以Excel直接進行分析。 此外,使用Excel,於輸入中,還可以「資料(D)/驗證(L)…」控制所輸入之資料必須介於那個範圍內?於輸入後,也可以「資料(D)/篩選(F)/自動篩選(F)」進行事後篩選,以過濾出不合理之錯誤資料。

5 直接開啟Excel檔案 由於,Excel是目前相當普及的軟體。也是現階段,最有可能會被用來輸入問卷調查資料的工具。故底下就舉一個將Excel檔案轉為SPSS資料檔的實例。 有一點要特別提一下,於Excel進行資料鍵入工作時,第一列之內容即是將來欄變數之名稱。雖然,Excel允許使用中/英文當欄名,字數也幾乎沒限制,上限1024個字。 不過,因為要將這些資料轉到SPSS進行分析,故建議您將字數縮到8個英文或4個中文字以內。否則,將只能取用前面8個英文(4個中文)而已;但會將原過長之欄名安排到『註解』處,當變數標籤。

6 假定,已以Excel完成一問卷資料之輸入:(存於『未購原因.xls』)
可以下示步驟,將其轉入SPSS: 先將『未購原因.xls』關閉

7 於SPSS,執行「檔案(F)/開啟舊檔(O)/資料(A)…」(或按 鈕)

8 按『檔案類型(T)』右側之向下箭頭,選擇要開啟之檔案類型(Excel(*.xls))
轉入適當磁碟資料匣

9 雙按要開啟之檔名(『未購原因xls』),或選取該檔名後按〔開啟〕鈕。若所要取用之資料,並非該檔案之第一個工作表,可於『工作單』處,按其右側向下箭頭,進行選擇。

10 確定已選擇「從資料第一列開始讀取變數名稱」,可將工作表第一列之內容,當成SPSS資料檔的變數名稱(若原名稱超過8個字元,將取用前面8個英文字元(4個中文)而已;但會將原欄名安排到『註解』處,當變數標籤) 按〔確定〕鈕,即可將Excel之內容轉入SPSS

11 馬上練習 將『手機考慮因素.xls』工作表內容,轉入SPSS。本例之欄名,有部份是超過4個中文字,如:『符合人體工學』與『附屬功能多』。

12 馬上練習 將『手機月費.xls』的第二個工作表『月費』內容,轉入SPSS。

13 以拖曳方式取得外部檔案 將外部之Excel檔案,以拖曳方式將其圖示,直接拉入SPSS『資料檢視』或『變數檢示』的任意位置。
其下有一加號,表其為複製性質。鬆開滑鼠後,將顯示: 往後之操作步驟,就與前文相同。

14 直接開啟本文檔案 若欲取得者,係本文型式之.txt文字檔:(便宜之排名.txt』)其內各欄內容係以空格當間隔符號。

15 可以下示步驟,將其轉入SPSS: 先將『便宜之排名.txt』關閉 於SPSS,執行「檔案(F)/讀取文字資料(R)」,轉入適當磁碟資料匣

16 雙按要開啟之檔名(『便宜之排名.txt』),或選取該檔名後按〔開啟〕鈕

17 於『您的文字檔符合預先定義的格式嗎?』處,選「否(O)」,按〔下一步〕鈕

18 於『您的變數如何排列?』處,選「分隔(D)」(本例係以空格當分隔符號);於『變數名稱包含在檔案的最上層嗎?』處,選「是(Y)」;續按〔下一步〕鈕

19 維持目前預設之設定:由第2筆開始、每筆一個觀察值、全部匯入,續按〔下一步〕鈕

20 選取所使用之分隔符號(本例為「空格(S)」),按〔下一步〕鈕(出現此警告,係因『台灣大哥大』名稱過長之故)
按〔確定〕鈕(『台灣大哥大』已被改為『台灣大哥』)

21 以捲動軸捲動,查一下轉換結果,看是否正確?若無誤,按〔下一步〕鈕

22 其上之設定均維持於「否(O)」即可,按〔完成〕鈕,將文字檔內容轉到SPSS之資料檔(僅『編號』欄需要將小數取消而已,其餘之內容均無問題)

23 取用表格之內容 假定,要分析之資料是公佈在網路(或Word文件)上的表格,您會考慮以何種方式將其轉入到SPSS?
較理想的作法是,以複製/貼上之技巧進行,將表格轉貼到Excel;將其存檔並關閉。然後,再以SPSS直接開啟Excel檔。

24 馬上練習 將『表格資料.doc』之Word表格內容,轉入SPSS。

25 轉存為其他軟體可用之資料 相反的情況,原為SPSS之資料檔,也可以轉存為其他軟體可用之資料。如:Excel、dBASE、Lotus、……;或文字型態的本文檔。由於,還是以轉存為Excel之活頁簿檔的情況最多。轉為Excel活頁簿檔的操作步驟: 開啟SPSS的資料庫檔(手機.sav』進行練習)

26 執行「檔案(F)/另存新檔(A)…」 按『存檔類型(T)』右側向下按鈕,選擇要將檔案轉存為那種類型?(本例選「Excel(*.xls)」)

27 於『檔案名稱(N)』處,輸入檔名

28 按〔儲存〕鈕,即可將其轉存成Excel之活頁簿檔

29 合併觀察值--利用指令 為縮短輸入資料時間,常將問卷分由幾個不同人進行輸入,於輸入結束後,再將其內容合併於一個檔案。假定,有如下兩資料檔,其變數名稱之定義、順序及個數完全相同。(可由一人建妥後,再分抄給其他幫忙輸入資料者,以確保每個人能拿到相同之定義): (資料-甲.sav』,其內有編號229~232等四筆問卷資料)

30 (資料-乙.sav』,其內有編號306~309等四筆問卷資料)

31 開啟『資料-甲.sav』(『資料-乙.sav』開啟或關閉均無所謂)
執行「資料(D)/合併檔案(G)/新增觀察值(C)…」,轉入資料匣

32 雙按『資料-乙. sav』之檔案圖示。右側所顯示者為『資料-乙. sav』之欄名內容,由於與『資料-甲
雙按『資料-乙.sav』之檔案圖示。右側所顯示者為『資料-乙.sav』之欄名內容,由於與『資料-甲.sav』完全相同。故左側並無任何無法配對之變數。

33 按〔確定〕鈕,即可將『資料-乙.sav』之所有觀察值,增添到『資料-甲.sav』之尾部

34 利用複製/貼上之技巧 其實,亦可以分別開啟兩檔,利用複製/貼上之技巧,將乙檔案之全部觀察值貼到甲檔案之尾部。
開啟『SPSS範例\Ch04\資料-甲.sav』 再執行一次SPSS,開啟『資料-乙.sav』,使兩檔同時開啟 按住『資料-乙.sav』之列號,以拖曳方式,將其觀察值全部選取 執行「編輯(E)/複製(C)」(或按Cttrl+C鍵),記下所選取之內容

35 轉到『資料-甲. sav』,點選其最底下空白列的列號按鈕,選取該列。以拖曳方式,選取與『資料-乙
轉到『資料-甲.sav』,點選其最底下空白列的列號按鈕,選取該列。以拖曳方式,選取與『資料-乙.sav』之筆數相同之列數(若不知道幾列?寧可多選幾列,等貼入後,再將多出之空白列刪除)

36 執行「編輯(E)/貼上(P)」(或按Cttrl+V鍵),將所記下之內容抄過來

37 合併變數--利用指令 若情況剛好相反,要合併之對象為變數欄(向右增加欄位內容,並非定義而已),可以「資料(D)/合併檔案(G)/新增變數(V)…」來處理。 如『手機1.sav』,其內有『問卷編號』、『有手機』與『月費』等欄:

38 而『手機2.sav』,其內有『問卷編號』、『大小適中』、『重量輕巧』與『顏色炫麗』等欄:
兩檔之觀察值筆數一致,且依『問卷編號』排妥順序。

39 擬將兩檔之欄位內容,合併成一個檔。假定,要彙集於『手機1.sav』內,其操作步驟為:
開啟『手機1.sav』(『手機2.sav』開啟或關閉均無所謂) 執行「資料(D)/合併檔案(G)/新增變數(V)…」,轉入資料匣

40 雙按『手機2. sav』之檔案圖示。右側為『手機1. sav』增加了『手機2
雙按『手機2.sav』之檔案圖示。右側為『手機1.sav』增加了『手機2.sav』之新變數後的結果;由於兩檔均有『問卷編號』,故將『手機2.sav』之『問卷編號』排除,並顯示於左側之方塊內。

41 按〔確定〕鈕,即可將『手機2.sav』內『大小適中』、『重量輕巧』與『顏色炫麗』等欄變數,合併到『手機1.sav』

42 利用剪貼技巧 其實,亦可分別開啟兩檔,利用複製/貼上之技巧,將乙檔案之某些欄位內容複製到甲檔案之尾部: 開啟『手機1.sav』
再執行一次SPSS,開啟『手機2.sav』,使兩檔同時開啟 按住『手機2.sav』之欄名標題,以拖曳方式,將『大小適中』、『重量輕巧』與『顏色炫麗』等三欄選取

43 執行「編輯(E)/複製(C)」(或按Cttrl+C鍵),記下所選取之內容
轉到『手機1.sav』,點選其最右側空白欄的欄名按鈕,選取該列。以拖曳方式,選取與同於先前所選之欄數(3欄)

44 執行「編輯(E)/貼上(P)」(或按Cttrl+V鍵),將所記下之內容抄過來。亦可將『手機2
執行「編輯(E)/貼上(P)」(或按Cttrl+V鍵),將所記下之內容抄過來。亦可將『手機2.sav』內『大小適中』、『重量輕巧』與『顏色炫麗』等欄變數,合併到『手機1.sav』

45 重新編碼 『重新編碼』係將某欄變數,依其內容進行合併,以縮減答案數。如,受訪者之月所得數字,分佈得相當凌亂,可將其縮減為『~20,000』、『20,001~40,000』、『40,001~60,000』與『60,001~』等幾組。 又如,使用A品牌者佔50%、B品牌者佔35%、C品牌者佔5%、D品牌者佔3%、E品牌者佔2%、……、K品牌者佔1%。若要將A~K品牌之次數分配全部列出,恐也太多!故可將其縮減為『A品牌』(50%)、『B品牌』(35%)與『其他品牌』(15%)三組而已。

46 SPSS計提供有兩種『重新編碼』: 將結果安排於同一變數 將結果安排於不同變數(本部份之實例,請參見第五章『次數分配』之說明) 前者,較為危險,萬一操作錯誤,會將原資料蓋成錯誤之結果!故通常是選擇後者,將轉換結果安排成另一個新變數;若做錯了,了不起將其刪除就是,原始資料則仍維持不變。 另一個不願將重新編碼的結果安排於同一變數之理由是,像原始所得資料係連續數值,可用來計算平均數、標準差、……等統計量。若將原數字直接轉換成分組結果,就變成是類別(組別)變數,僅能求次數,並無法計算平均數、標準差、……等統計量;且也無法拿來進行更進一步之均數檢定,那將是一大損失!

47 SPSS之「編輯(E)」指令,並無「取代」之功能項。若要執行該動作,就得利用「轉換(T)/重新編碼(R)/成相同變數(S)…」。
假定,『手機廠排.sav』之資料,當『有手機』欄為2時,表該受訪者並無手機,其『手機廠排』欄內之答案就應該為0,但目前該欄內存有部份資料是錯誤的。如,第2, 6, 7列,其『手機廠排』欄就有非0之資料:

48 可以下示步驟,找出當『有手機』欄為2時,即將其『手機廠排』欄內之答案全數替換成0:
執行「轉換(T)/重新編碼(R)/成相同變數(S)…」(若其上已有其他不相關之設定,可按〔重設〕鈕,將其全數清除)

49 選『手機廠牌』,按 鈕,將其送到右側之『變數(V)』方塊

50 按 鈕

51 選「包含滿足條件時的觀察值(I):」,續選『有手機』,按 鈕,將其送到右側

52 按 鈕及 鈕,將其條件安排為『有手機=2』,表無手機時才要進行後續之重新編碼(條件式亦可以鍵盤進行輸入)

53 按〔繼續〕鈕,回上層對話方塊,可發現已顯示有過濾條件:若『有手機=2』

54 按 鈕,左下選「全部其他值(O)」,並於右上『新值為』之「數值(L):」處輸入0,表示將全部資料改為0(當其符合『有手機=2』之條件時)

55 按〔繼續〕鈕,將此一設定搬到『舊值 --> 新值(D)』方塊,顯示「ELSE--> 0」(此動作經常被忘記,結果什麼更新也沒做!)

56 按〔繼續〕鈕,回上層對話方塊

57 按〔確定〕鈕結束,可找出所有符合『有手機=2』條件的觀察值,並將其『手機廠牌』資料均改為0。原第2, 6, 7列,其『手機廠排』欄已改為0。

58 計算 『重新編碼』只是將某值轉換成簡單之新值,並無法進行計算。若碰上得經過使用某些欄位內容進行計算,才可獲得之新內容,就得利用「轉換(T)/計算(C)…」。以『總平均.sav』為例:

59 擬依『國文』4學分、『英文』3學分、『數學』3學分之權數,計算其加權平均,置入另一新『平均』欄。其處理步驟為:
執行「轉換(T)/計算(C)…」

60 於『目標變數(T)』處,輸入欲存放運算結果之新變數名稱『平均』
點按『數值運算式(E)』下之文字方塊,將顯示出游標。即可輸入運算式。變數名稱、運算符號或數字均可以鍵盤進行輸入,當然也可按其上所提供之按鈕來輸入。要輸入變數名稱,也可於左側選妥名稱,續按 鈕,將其送到右側。本例輸入: (國文*4+英文*3+數學*3)/10 以計算加權平均:

61 若有過濾條件,尚可按〔若(I)…〕鈕進行設定(本例無過濾條件)
最後,按〔確定〕鈕,計算出平均成績,置入新變數『平均』欄

62 置換遺漏值 假定,『置換遺漏值.sav』內,有幾筆『平均月費』為未輸入任何資料之系統遺漏值(僅顯示點號,如:第2, 3, 7列之內容):

63 可以下示步驟,將其替換成某一特殊值: 執行「轉換(T)/置換遺漏值(V)…」

64 按『方法(M)』處向下箭頭,選擇要替換成何種新值?(本例選「數列平均數」)
左側選『平均月費』,按 鈕,將其送到右側『新變數(N)』下

65 『名稱(A)』處,自動補上之『平均月_1』即SPSS自動安排之新變數名稱。但仍允許我們自行修改,本例將其改為『月費_1』:

66 按 鈕,換掉舊名稱

67 按〔確定〕鈕,產生新變數『月費_1』,其內已將原系統遺漏值,均改為平均值291(第2, 3, 7列)


Download ppt "資料轉換."

Similar presentations


Ads by Google