第1章 緒 論
第一節 統計學的意義 統計學的涵義是: 對於蒐集到的資料,給予整理、呈現、分析和解釋,並 進而根據分析的結果,對未知母體特徵,做合理的推論 和研判。 1.敘述統計(descriptive statistics) 指對現有資料進行蒐集、整理、分析和解釋等處理。 目的:計算一團體某特徵上的數值資料,經統計分析之後, 再回頭來解釋該團體在該特徵上所具有的事實和隱含意義。
第一節 統計學的意義 2.推論統計(inferential statistics) 第一節 統計學的意義 2.推論統計(inferential statistics) 指根據敘述統計分析的結果,探討如何在不確定的情形下, 對資料的母體特徵,進行預測或考驗等推論工作。 目的:是要依據已知的樣本統計數值推測未知母體數值。 母體:母體係研究者所要調查或研究的全部個體(或對 象)。 樣本:樣本是母體的部分集合。
第一節 統計學的意義 母體和統計量的符號 描述母體特質的量數,稱為母數或參數(parameter)。一 般以希臘字母代表之。 第一節 統計學的意義 母體和統計量的符號 描述母體特質的量數,稱為母數或參數(parameter)。一 般以希臘字母代表之。 描述樣本特質的統計量數,稱為統計量(statistic),通常 以英文字母代表之。
第二節 統計資料的性質 統計資料的性質和分類 統計資料是指有關研究對象特質的紀錄。依資料可否計 算的屬性可區分為: 屬量資料 第二節 統計資料的性質 統計資料的性質和分類 統計資料是指有關研究對象特質的紀錄。依資料可否計 算的屬性可區分為: 屬量資料 可以用數值來表示或區分的資料,且資料本身可以 做數學運算。 間斷型資料:能用計數(countable)方式獲得 。 連續型資料:不可計數而必須用測量(measurable)方式獲得 。 屬值資料 不能以數值表示,而是以類別來區分的資料。 資料本身不具數學運算性質。
第三節 資料衡量尺度 分為名目尺度、順序尺度、等距尺度和比例尺度: 名目尺度(nominal scale)資料 第三節 資料衡量尺度 分為名目尺度、順序尺度、等距尺度和比例尺度: 名目尺度(nominal scale)資料 名目尺度是指可以依資料的性質來區分或分類,並以代號或 數字來標示類別。 如性別、血型、職業別 。 順序尺度(ordinal scale)資料 順序尺度指可以依照本身的大小、強度、高低等程度,來分 類和排序的資料。 (1)能區分類別。 (2)能比較資料的大小或高低等程度。 (3)不是屬量資料,所以不能作加減運算。
第三節 資料衡量尺度 等距尺度(interval scale)資料 第三節 資料衡量尺度 等距尺度(interval scale)資料 等距尺度資料是指資料不但有順序尺度性質,並且基本單位的 相鄰兩數值間之距離相等,但不具有真正零點。 (1)能區分類別。 (2)能比較各資料間的大小或高低等程度。 (3)能作加減運算。 (4)不能作倍數運算。 如華氏、攝氏溫度。
第三節 資料衡量尺度 高階資料v.s低階資料 比率尺度(ratio)資料 第三節 資料衡量尺度 比率尺度(ratio)資料 比率尺度具有等距資料的性質,同時因具有絕對零點,兩資料 數值間的比值或倍數是有意義的。 絕對零點:其尺度上的「零」代表「完全無」的意思,有絕 對客觀性。 如公斤秤、臺斤秤或英鎊秤等。 高階資料v.s低階資料
第三節 資料衡量尺度 常用的字母符號
第四節 加總的運算法則 希臘字母Σ讀作[sigma]表示「總和」之意。 假設代表學生身高的變數為x,則5個學生身高的總和,寫作:
第四節 加總的運算法則 一般加總的通式寫法是: xi表示「任何項變數值」,i表示第i項位置,而i=1表示起 始項,i=n表示終止項。 第四節 加總的運算法則 一般加總的通式寫法是: xi表示「任何項變數值」,i表示第i項位置,而i=1表示起 始項,i=n表示終止項。 唸作:「從i=1至i=n的所有變數值的總和」。
第四節 加總的運算法則 加總符號的簡化 一般省略原則為: (1)如果對起始項i和終止項n有共識,則可簡化為: 第四節 加總的運算法則 加總符號的簡化 一般省略原則為: (1)如果對起始項i和終止項n有共識,則可簡化為: (2)如果起始項不是1,則不宜省略,但其他代號必要時可簡化為:
第四節 加總的運算法則 (3)如果終止項不是n,則不宜省略,但其他代號必要時可簡化為: 第四節 加總的運算法則 (3)如果終止項不是n,則不宜省略,但其他代號必要時可簡化為: 總而言之,當代號省略後不會引起誤解時,才可簡化,如果省略 有被誤解的可能,則須保留,不可簡化。
第四節 加總的運算法則 常用加總運算法則
第四節 加總的運算法則
第五節 認識SPSS的統計視窗 和基本操作 一、認識SPSS編輯視窗的組成 (一)檔案列 (二)功能表列 配合圖1-3,檔案列位在第一橫列,它表示目前資料檔的名 稱。如果目前資料編輯工作尚未輸入檔名,則系統會自動提 供預設的檔名「未命名untitled」。 (二)功能表列 配合圖1-3,功能表列位在第二橫列,每個功能表都還包含 一系列的功能選項,只要用滑鼠點選,即可執行各項工作。
第五節 認識SPSS的統計視窗 和基本操作 一、認識SPSS編輯視窗的組成 (三)工具列 (四)資料編輯區 配合圖1-3,工具列以圖示顯現,方便使用者點選它們來執行編 輯工作。 (四)資料編輯區 配合圖1-3,它是視窗的主體部分,為資料輸入的區域,包含 「資料檢視」(data view)和「變數檢視」(variable view)兩張工作表。 由於螢幕只容許一張工作表顯現,所以使用者必須點選「工作表 切換標籤」(位在編輯區左下端,圖1-3),來切換螢幕上的工 作表。 編輯區主要包含許多長形格,稱為儲存格(圖1-3),為資料鍵 入的地方。
第五節 認識SPSS的統計視窗 和基本操作 一、認識SPSS編輯視窗的組成 (五)狀態軸 配合圖1-3,它位在視窗最下一列,顯示目前所處的編輯狀 況,包含正在執行的命令或程序、觀測的個數,或顯示是否 正在執行過濾或加權等特殊功能。
第五節 認識SPSS的統計視窗 和基本操作 圖1-3 檔案列 功能表列 工具列 資料編輯區 工作表切換標籤 儲存格 狀態軸
第五節 認識SPSS的統計視窗 和基本操作 二、認識對話盒的組成 (一)名稱列(title) (二)文字框(text box) 配合圖1-4a,名稱列位在對話盒的第一列,顯示目前對話盒的 種類名稱。 (二)文字框(text box) 1.空白框 配合圖1-4a,其框內是空白的,沒有預設值,允許使用者輸 入資料。 2.預設式長框 配合圖1-4b,其框內有預設值,如果使用者未修改成新資料 值,則自動啟用系統的預設值。
第五節 認識SPSS的統計視窗 和基本操作 (三)選項圓鈕(optional buttons) 3.空白清單框 配合圖1-4c,此種空框允許使用者從另一框移入數個變數。 4.預設清單框 配合圖1-4a,此框內列示內定的變數或函數式清單,允許使 用者選取其中的函數式,移入「空白清單框」內。 (三)選項圓鈕(optional buttons) 配合圖1-4b,其形狀為空心圓「 」。每個圓鈕代表一個選項。 通常數個相互排斥的選項圓鈕並排出現,使用者只能點選其中一 個選項圓鈕。點選其中一個選項,空心圓「 」會變成黑心圓 「 」。
第五節 認識SPSS的統計視窗 和基本操作 (四)下拉式清單(drop-down list) (五)檢核小方框(check box)
第五節 認識SPSS的統計視窗 和基本操作 (六)命令鈕(command buttons) (七)次對話盒鈕(sub-dialog box) 等;次對話盒內的命令鈕為 等。 此外,尚有方向鈕 、 、 、 (圖1-4a)等,表示選項移動 的方向。 (七)次對話盒鈕(sub-dialog box) 配合圖1-4c ,當命令按鈕的尾部附有3個黑點「...」時,譬 如: 、 等,表示點選該「命令鈕」時,將會開啟「次 對話盒」,尚有進一步的資料等待檢選和輸入。
第五節 認識SPSS的統計視窗 和基本操作 圖1-4a 對話盒的組成
第五節 認識SPSS的統計視窗 和基本操作 圖1-4b 對話盒的組成
第五節 認識SPSS的統計視窗 和基本操作 圖1-4c 對話盒的組成
第五節 認識SPSS的統計視窗 和基本操作 一、問卷各題項的屬性分析 一般一張問卷的內容包含多個題項,每一題項代表一個變項。 變項依測量性質分屬質和屬量兩類。由於電腦比較擅於處理 數值和英文字母,所以問卷的各變項須先進行數字化,即以 數值的型態來表示,以利電腦的快速處理。
第五節 認識SPSS的統計視窗 和基本操作 例6 某研究員以問卷調查10名國中二年級學生的性別、身高、體 重及數學、語文月考成績,問卷表及其結果如下: 表1-2 問卷表範例
第五節 認識SPSS的統計視窗 和基本操作 表1-3 問卷調查10名學生的結果
第五節 認識SPSS的統計視窗 和基本操作 1.性別:以「sex」代表,為類別尺度,分為二類:1代表男性、 2代表女性,是屬質資料。 2.身高:以「height」表示,為比率尺度,是屬量資料。 3.體重:以「weight」表示,為比率尺度,是屬量資料。 4.數學月考成績:以「score_1」表示,為等距尺度,是屬量資 料。 5.語文月考成績:以「score_2」表示,為等距尺度,是屬量資 料。 6.加權平均:以「mean」表示,為各橫列的平均。
第五節 認識SPSS的統計視窗 和基本操作 二、如何編碼 1.表1-2為問卷表,每一張問卷表皆由1個觀測個體填寫。問卷 表的每一題項,代表1個變數,譬如性別、身高、體重等題項, 均為變數。 2.在表1-4的編碼表中,每一橫列代表1個變數,而其空格內的 資料,代表該變數的屬性。 3.對例6的各題項屬性(即變數)進行屬性分析,然後填入編 碼表,最後結果如表1-4所示。
第五節 認識SPSS的統計視窗 和基本操作 表1-4 編碼表
第五節 認識SPSS的統計視窗 和基本操作 (一)名稱(name) 以下將分別介紹「變數檢視」工作表內變數屬性的意義: 在「變數檢視」工作表定義的「名稱」,能顯現在「資料檢 視」工作表的第一橫列上(圖1-5b)。
第五節 認識SPSS的統計視窗 和基本操作 圖1-5a 變數檢視工作表:「名稱」欄設定
第五節 認識SPSS的統計視窗 和基本操作 圖1-5b 資料檢視工作表:注意和的名稱相同
第五節 認識SPSS的統計視窗 和基本操作 (二)類型(type) 點選圖1-6a,可以獲得對話盒:「變數類型」,配合圖1-6b, 該欄提供八種資料類型(numeric數字型、comma、dot、 scientific notation、date、dollar、custom currency、string字串型), 其中以數字型和字串型兩類型最為常用。 「類型」欄設定的操作步驟: (1)點選「類型」欄中的儲存格,即出現對話盒鈕 (圖1-6a)。 (2)按下 鈕,開啟對話盒(圖1-6b)。 (3)點選所要的「類型」按鈕(圖1-6b)。
第五節 認識SPSS的統計視窗 和基本操作 (4)系統預設該儲存格為「數字」型,因此使用者若不點按 任何「選項圓鈕」,系統會自動預設變數的類型為「數字」 (圖1-6c)。 (5)點選「確定」命令鈕,即完成設定。 圖1-6a 「類型」欄設定
第五節 認識SPSS的統計視窗 和基本操作 圖1-6b 對話盒:變數類型 圖1-6c 對話盒:變數類型
第五節 認識SPSS的統計視窗 和基本操作 (三)寬度(width)、小數(decimals) (1)當滑鼠停在該「寬度」欄的儲存格上,點選一下,即可 彈出上下箭頭鈕 ,按此箭頭鈕,即可調整所要的寬度 (圖1-7)。 (2)亦可直接在儲存格內,輸入所要變數的寬度值(圖1-8) 。 圖1-7 「寬度」欄設定 圖1-8 「小數」欄設定
第五節 認識SPSS的統計視窗 和基本操作 (四)標記(label) 配合圖1-9a,該欄位顯示變數值的標記或註解,它是對變數的補充 說明。
第五節 認識SPSS的統計視窗 和基本操作 圖1-9b 設定變數的「標記」
第五節 認識SPSS的統計視窗 和基本操作 (五)數值(value) 「數值」欄設定的操作步驟: (2)按 按鈕,開啟對話盒。 (3)在對話盒內的「數值」框輸入「1」,在「數值標記」框輸 入「男生」。 (4)再按「新增」鈕,立即在「空格清單」內出現「1="男生"」 (圖1-10b)。 (5)重複(3)、(4)步驟,使清單框再出現「2="女生"」(圖1-10c)。 (6)設定完成,點按「確定」鈕,回到「變數檢視」工作表(圖 1-10d)。
第五節 認識SPSS的統計視窗 和基本操作 圖1-10a 「數值」欄設定
第五節 認識SPSS的統計視窗 和基本操作 圖1-10b 對話盒:數值標記 圖1-10c 對話盒:數值標記
第五節 認識SPSS的統計視窗 和基本操作 圖1-10d 已完成「數值」設定
第五節 認識SPSS的統計視窗 和基本操作 (六)遺漏值(missing value) 「遺漏」欄設定的操作步驟: (2)按 鈕,開啟對話盒。 (3)若點選對話盒的「無遺漏值」圓鈕(圖1-11b),表示目前變 數的觀測值正確,沒有遺漏值。此為系統的預設值。 (4)若可能出現遺漏值,則須在「離散遺漏值」的空白框,填入 使用者所設定的遺漏值代號,譬如對字串型變數設定「NR」作 為遺漏值代號,或對數字型變數設定「999」作為遺漏值代號 (圖1-11c)。 (5)點選「確定」鈕,回到「變數檢視」工作表。
第五節 認識SPSS的統計視窗 和基本操作 圖1-11a 「遺漏」欄設定
第五節 認識SPSS的統計視窗 和基本操作 圖1-11b 對話盒:遺漏值 圖1-11c 對話盒:遺漏值
第五節 認識SPSS的統計視窗 和基本操作 (七)欄(column) 配合圖1-12,該欄屬性是指變數所在的欄位寬度。 圖1-12 「欄寬」欄設定
第五節 認識SPSS的統計視窗 和基本操作 (八)對齊(align)、測量(measure) 這兩屬性分別表示變數資料在欄位的對齊方式(向左、向右 或居中),以及變數值的測量(尺度、次序的、名義的)的 設定。 圖1-13 「對齊」欄設定
第五節 認識SPSS的統計視窗 和基本操作 圖1-14 「測量」欄設定
第五節 認識SPSS的統計視窗 和基本操作 一、資料的計算 例7 下表為10名學生的第一次月考(test_1)和第二次月考(test_2)成 績。 ①試建立兩次月考總和的新變數「sum」。 ②試把月考分數改成90分以上為1等,80至89分為2等, 70至79分為3等,69分以下為4等。 表1-5 10名學生的兩次月考成績
第五節 認識SPSS的統計視窗 和基本操作 STEP1 (1)依表1-5,在「變數檢視」工作表,定義變數「test_1」 和變數「test_2」,如圖1-15a。 (2)然後將表1-5的數值輸入「資料檢視」工作表內的儲存格 內,如圖1-15b。 圖1-15a 界定變數屬性
第五節 認識SPSS的統計視窗 和基本操作 圖1-15b 輸入數值
第五節 認識SPSS的統計視窗 和基本操作 STEP2 (1)在「資料檢視」工作表上方的功能表列(圖1-16),按「轉 換」→「計算」。 (2)打開主對話盒:「計算變數」(圖1-17)。 圖1-16 選擇轉換:計算變數
第五節 認識SPSS的統計視窗 和基本操作 STEP3 (1)在「計算變數」主對話盒左側的「目標變數」長框內, 輸入「sum」(圖1-17)。 (2)把左下清單框內的「test_1」和「test_2」兩變數(圖1- 17),移入右側「數值運算式」長框內(圖1-17)(注 意:兩變數中間需輸入運算符號「+」號)。 (3)按「確定」鈕(圖1-17),回到「資料檢視」工作表 (圖1-18)。
第五節 認識SPSS的統計視窗 和基本操作 圖1-17 主對話盒:計算變數
第五節 認識SPSS的統計視窗 和基本操作 STEP4 設定完畢,在「資料檢視」工作表上,顯現新變數「sum」和 計算結果(如圖1-18)。 圖1-18 完成新建立的變數和計算結果
第五節 認識SPSS的統計視窗 和基本操作 二、資料的重新編碼 STEP1 將例7的資料,依下表方式編列等級: (1)在「資料檢視」工作表上方的功能表列(圖1-19),按 「轉換」→「重新編碼」→「成不同變數」。 (2)開啟主對話盒:「重新編碼成不同變數」(圖1-20)。
第五節 認識SPSS的統計視窗 和基本操作 圖1-19 選擇轉換:重新編碼成不同變數
第五節 認識SPSS的統計視窗 和基本操作 STEP2 (1)在「重新編碼成不同變數」主對話盒內(圖1-20),把左 側清單框內的「test_1」移入「數值變數→輸出變數」框(圖1- 20)。 (2)在「輸出之新變數」區的「名稱」框內,鍵入「grade_1」 (圖1-20)。 (3)然後按「變更」鈕(圖1-20)。 (4)完成上述三步驟,在「數值變數→輸出變數」框內,就出現 「test_1→grade_1」(圖1-20)。 (5)重複上述四步驟,使「數值變數→輸出變數」框內,新增加 「test_2→grade_2」。 (6)按「舊值與新值」鈕(圖1-20),開啟次對話盒(圖1-21)。
第五節 認識SPSS的統計視窗 和基本操作 圖1-20 主對話盒:重新編碼成不同變數
第五節 認識SPSS的統計視窗 和基本操作 在次對話盒「重新編碼成不同變數:舊值與新值」內的設定步驟 如下(圖1-21): (1)設定69分以下為第4級: ①點選「舊值」區的「範圍」圓鈕,然後在「從最低值」框內,鍵 入「69」(圖1-21a)。 ②在「新值為」區域,點選「數值」圓鈕,並輸入「4」到框內 (圖1-21a)。 ③按「新增」(圖1-21a),立即在「舊值→新值」大方框內,產 生「Lowest thru 69→4」(圖1-21a)。 (2)依據相同的步驟,如圖1-21a所示,在框輸入「70」和 「79」;在框輸入「3」;按「新增」鈕,立即在右側大方 框內產生「70 thru 79→3」(圖1-21b)。 (3)其餘類推,直到如圖1-21b的右側大方框,產生「90 thru Highest→1」(圖1-21b),才停止設定。 (4)設定完畢,最後按「繼續」鈕(圖1-21b),回到「資料檢 視」工作表(圖1-22)。
第五節 認識SPSS的統計視窗 和基本操作 圖1-21a 次對話盒:舊值與新值 圖1-21b 次對話盒:舊值與新值
第五節 認識SPSS的統計視窗 和基本操作 STEP4 請仔細檢核圖1-22,當完成重新編碼,在「資料檢視」工 作表上,將出現新增加的grade_1和grade_2兩變數,而該兩 變數分別是test_1和test_2兩變數等級化的結果。
第五節 認識SPSS的統計視窗 和基本操作 圖1-22 新增等級化的變數grade_1和grade_2