Chapter 1 機率與統計的本質
學習目標 清楚統計名詞 的知識。 清楚區分統計 的兩大分支。 辨認數據 的型態。 辨認變數 的測量尺度。 辨認四種基本 的抽樣技術。 解釋觀察型研究與實驗型研究之間 的差異。 解釋如何使用 與誤用統計。 解釋電腦與掌上型計算機在統計上 的重要性。
是否曾經讀過類似報導? 每 7 個美國家庭幾乎就有一個即使買了健康保險也付不 出醫療帳單。(資料來源:Psychology Today) 每天吃 10 公克纖維可以降低患心臟病風險達14%。 (資料來源:Archives of Internal Medicine, Reader’s Digest) 每週運動 2 到 3 次每次 30 分鐘可以增加高密度脂蛋白 達 10%,甚至高達15%。(資料來源:Prevention)
是否曾經讀過類似報導? 在 2008 年,大學生平均背負卡債 3,173 美元。 (資料來源:Newser.com) 大概有 15% 的美國男性慣用左手,而女性則有 9%。 (資料來源:Scripps Survey Research Center) 那些收看 Jay Leno《今夜秀》(Tonight Show)的觀 眾,他們年紀的中位數大概是 48.1 歲。(資料來源: Nielsen Media Research)
統計學 (statistics) 是一種收集、組織、摘要、分析數據以及從中獲取結論的科學。
大學生學習統計的理由 就像許多專業人士一樣,你必須能夠閱讀與了解專 業裡的統計研究報告。為了具備這一類的理解,你 必須認識這些報告使用的名詞、符號、觀念以及統 計程序。 既然統計是一種基本的研究工具,你很有可能接手 一項專業領域內的研究。為了完成任務,你可能要 會設計實驗或是問卷;收集、組織、分析與摘要數 據;更可能要為未來找到可靠的預測或預估。最後, 你必須用自己的言語與他人溝通研究的成果。
大學生學習統計的理由 你也可以因為習得統計知識變成更棒的顧客或是 公民。比如說,你可以依據消費者研究決定買哪 一項產品,或是根據「運用研究」得知政府開支 的決策等等。
1-1 敘述統計學與推論統計學 變數 (variable) 是一種特徵或屬性,它可以假定不一樣的數字。 數據 (data) 1-1 敘述統計學與推論統計學 變數 (variable) 是一種特徵或屬性,它可以假定不一樣的數字。 數據 (data) 隨機變數 (random variables) 數據集(data set)
統計學的兩大領域 1. 敘述統計學 (descriptive statistics) 包含收集、組織、摘要以及呈現數據的學問。 2. 推論統計學 (inferential statistics) 包含估計、假設檢定、決定變數之間的關係、進行預測等等透過把樣本結果一般化到母體的工作。 母體 (population) vs 樣本 (sample)
觀念應用 1-1 出席率與成績 讀取下述出席率與成績的數據,並回答問題。 觀念應用 1-1 出席率與成績 讀取下述出席率與成績的數據,並回答問題。 一項針對 Manatee Community College 的研究顯示, 出席率達 95% 到100% 的學生通常在班上會拿 A。出席 率達 80 到 90% 的學生會拿 B 或C。至於那些出席率低 於 80% 的學生不是拿 D 就是拿 F,要不然就是最後把課 退掉。 根據這一項資訊,出席率與成績是相關的。出席率 愈高,愈有可能拿到高分。如果你改善出席率,你的成 績非常有可能會改善。有許多因素會影響你某一門課的 成績,其中一項你可以控制的就是你的出席率。經常上 課會增加你學習的機會。
觀念應用 1-1 出席率與成績 1. 這一項研究的變數為何? 2. 這一項研究的數據為何? 3. 此處使用敘述統計學,還是推論統計學,或是兩者都 有使用? 4. 這一項研究的母體為何? 5. 是否收集樣本?如果是,從哪裡收集? 6. 由已知資訊,評論變數之間的關係。 答案請見課本 p25
1-2 變數與數據型態 變數的分類 數據 屬性的 屬量的 離散的 連續的
離散變數 (discrete variables) 的數字通常是整數,它們是可數的。 連續變數 (continuous variables) 可以是任意兩個數字之間的數字。透過測量取得這一類的數字。它們通常包含分數與小數。
四種常用的尺度 1. 名目尺度測量值 (nominal level of measurement) 是一種類別數據,類別與類別之間彼此互斥,而且無法為這些類別安排順序或是進行排名。 2. 順序尺度測量值 (ordinal level of measurement) 是一種類別數據,類別之間可以被排序;但是,類別之間並沒有固定大小的差距。
四種常用的尺度 3. 區間尺度測量值 (interval level of measurement) 是一種可以排序的數據,測量單位之間的差距是固定的;但是這一級測量尺度沒有原點(0)。 4. 比例尺度測量值 (ratio level of measurement) 有所有區間尺度測量值的特質,加上原點。另外,同樣單位的數據可以計算比例。
觀念應用 1-2 安全旅行 閱讀以下關於運輸業的資訊並回答問題: 交通安全 以下的表格顯示 1998 年每一種運輸業的職業傷害次數。
觀念應用 1-2 安全旅行 1. 這一項研究的變數為何? 2. 哪幾個變數是屬性的?哪幾個變數是屬量的? 觀念應用 1-2 安全旅行 1. 這一項研究的變數為何? 2. 哪幾個變數是屬性的?哪幾個變數是屬量的? 3. 哪幾個變數是離散的?哪幾個變數是連續的? 4. 確認每一個變數的測量尺度。 5. 數據顯示鐵路是最安全的交通工具。這是不是意味著 比起其他交通工具,鐵路交通事故比較少?解釋之。 6. 有什麼樣的因素(除了安全以外)會影響人們選擇交 通工具? 7. 從已知的資訊,評論變數之間的關係。 答案請見課本 p25
1-3 數據收集與抽樣技術 四種基本的抽樣方法 隨機抽樣 系統抽樣 分層抽樣 群集抽樣
x x
觀念應用 1-3 美國文化與藥物濫用 假設你是 Family Research Council 的成員,而且愈來愈關 心職業運動員濫用藥物的情況。你籌備一項計畫,並且 進行一項調查,看美國文化(電視、電影、雜誌與流行 音樂)如何影響非法使用藥物。你的調查包含 2250 位美 國各階層的成人和青少年。某個消費者團體希望得知更 多關於這一項調查的資訊。請回答以下關於調查的問題。
觀念應用 1-3 美國文化與藥物濫用 1. 你使用哪一種調查方法(電話、郵件或面訪)? 2. 你未採用的那些方法有什麼樣的優缺點? 3. 你使用哪一種測量尺度?為什麼? 4. 你使用隨機機制決定誰是樣本嗎? 5. 你使用哪一種隨機機制(分層抽樣、系統抽樣、群集抽 樣或方便樣本)? 6. 你使用的方法為什麼比較適合你的數據收集計畫? 7. 假如某方便樣本只包含青少年,那麼研究結果會有什麼 樣的改變? 答案請見課本 p25
1-4 觀察型研究與實驗型研究 觀察型研究 (observational study) 是指研究員只會觀察現在發生了什麼,或是過去發生了什麼,而且嘗試根據這些觀察結果下結論。 實驗型研究 (experimental study) 是指研究員會操作其中一個研究變數,並且試著決定這樣的操作如何影響其他變數。
實驗型研究的獨立變數 (independent variable) 是指由研究員操作的變數,所以獨立變數也叫做解釋變數 (explanatory variable),而記載實驗結果的變數叫做依變數 (dependent variable),也叫做反應變數 (response variable, outcome variable)。 交絡變數 (confounding variable) 是指和獨立變數一樣會影響依變數(反應變數)的變數,但是它卻與獨立變數分不開。
觀念應用 1-4 無煙菸草研究 當抽菸不利健康的證據持續被發現,人們嘗試了各種 戒菸的辦法。許多人試著嚼菸草,或者嚼一種叫做無煙菸 草的替代品。把小量的菸草放在臉頰與牙床之間,從菸草 釋放出來的少量化合物會被吸收進入血液,產生吸菸的感 覺。這樣的事實促使對無煙菸草的反效果進行研究。 一項研究挑選了 40 位大學生,其中 20 位安排嚼無煙 菸草,剩下的 20 位則嚼一種形狀和味道皆類似無煙菸草 的替代品(注意,該項替代品是無害的)。這些學生被隨 機指定給其中一組。在開始嚼之前與嚼了 20 分鐘之後, 都會記錄每一位學生的血壓及心跳。嚼無煙菸草的那一組 心跳明顯提高了。請回答以下的問題。
觀念應用 1-4 無煙菸草研究 1. 這是什麼型態的研究(觀察型、準實驗型或實驗型)? 2. 獨立變數與依變數為何? 3. 哪一組是處理組? 4. 學生會因為知道參與研究因而改變心跳嗎? 5. 列舉一些可能的交絡變數。 6. 你認為這是研究無煙菸草效果的好方法嗎? 答案請見課本 p26
1-5 使用統計與誤用統計 統計可能被誤解的情形 懷疑樣本 曖昧平均 改變主題 分離的統計數字 隱晦的聯繫 誤導的統計圖 錯誤的問卷 1-5 使用統計與誤用統計 統計可能被誤解的情形 「圖不會說謊,但說謊者會畫圖」 懷疑樣本 曖昧平均 改變主題 分離的統計數字 隱晦的聯繫 誤導的統計圖 錯誤的問卷
1-6 電腦與掌上型計算機 以往,統計計算都是用筆和紙完成的。但是,由 於計算機的發明,數值計算變得相當容易。電腦可以 執行所有的數值計算。人們只需要把數據輸入電腦, 接著使用適當的指令;電腦會把結果印出來,或是顯 示在螢幕上。 市面上有許多統計套裝軟體。本書使用微軟的 Excel,Excel 指令會放在每一個相關小節的最後面, 叫做「技術步驟解析」。
結語 統計學有兩個分支:敘述統計學與推論統計學。敘述統計 學包含數據的收集、組織、摘要以及呈現。推論統計學則 包含各種從樣本推論母體的工作,估計與假設檢定,決定 關係和進行預測。推論統計學乃植基於機率論。(1-1) 數據可以被分為屬性的和屬量的。屬量的數據還可以被分 為離散的和連續的,就看數字(數據= 數字+單位)的本 質。也可以用各種測量尺度區分數據。有四種基本的測量 尺度,分別是名目、順序、區間和比例。(1-2)
結語 因為大部分研究用的母體都很大,統計學家會使用母體的 一部分,叫做樣本,收集與研究相關的數據。取得樣本有 四種基本的方法:隨機抽樣、系統抽樣、分層抽樣、群集 抽樣。(1-3) 基本上有兩種類型的統計研究:觀察型研究和實驗型研 究。當進行觀察型研究的時候,研究員觀察現在和過去發 生了什麼事,然後根據這些觀察下結論,他們不會試圖以 任何形式操作與研究有關的變數。(1-4)
結語 當進行實驗型研究的時候,研究員操作一個或是多個獨立 變數(解釋變數),並且觀察這樣的改變(操作)如何影 響依變數(反應變數)。(1-4) 最後,統計數字用在很多地方。人們每天都遇得到,諸如 讀報章雜誌、聽廣播、或者是看電視的時候。既然統計被 用在各個領域,受教者應該學習統計的辭彙、概念以及程 序。同時,每一個人都應該知道統計會如何被誤用。(1-5) 今日,電腦和掌上型計算機被廣泛地應用在與統計有關的 各種計算。(1-6)
THE END