國立台北教育大學 數學技資訊教育學系 陳幸玫 統計素養 ~以抽樣調查為例 國立台北教育大學 數學技資訊教育學系 陳幸玫 資料來源:統計學的世界(Moore, 2002, 鄭惟厚 譯),看漫畫學統計(Gonick & Smith, 2003, 鄭惟厚 譯) ,自由時報(2006/11/01, 2007/01/10),聯合報(2007/03/20) ,從報章雜誌中統計訊息的理解探討國民基本統計素養 國科會 研究成果報告(NSC 95-2521-S-152-004-) ,Statistical Reasoning for Everyday Life (Bennett, Briggs, Triola, 2003)
統計和數學 統計是數學的一個次領域嗎? 統計只牽涉到數學嗎? 統計除了數學還有什麼? 統計教學只是數學公式的導出和計算嗎?
為什麼需要統計 為了做決定,可是面對的訊息千變萬化… 為了解決不確定的問題… 為了從雜亂無章的訊息中,理出頭緒… …………………. 為了表示有學問,言之有 ”據”… 為了讓我們知道可以偷懶到什麼程度而不至於太離譜…
統計需要什麼 訊息資料 數學 機率 描述、分析、推論 道德 為何需要(why) 從哪裡來(where) 怎麼取得(how) 什麼形式(what) 數學 簡化和呈現數據訊息 機率 量化不確定的程度 描述、分析、推論 用詞遣字是否適當 怎麼描述我們對估計準確程度的信心 用的統計方法是否恰當 相關還是因果 是否有潛在變數或中介變數 該拒絕還是該接受 推論結果合不合理? 道德 數字不會說謊,但說謊的人會想出辦法 (Charles Grosvenor)
最新一季ACNielsen閱報率大幅領先/自由時報最受讀者肯定 加權閱報人口數 領先第二名48萬人之多 ACNielsen七至九月、也就是最新一季的調查顯示,在讀者昨日閱讀主要報紙種類中,「自由時報」獲得閱報率十六點三%,領先居次的「蘋果日報」的十三點五%將近三個百分點,換算成加權閱報人口數,比蘋果日報多出四十八萬人,更大幅超前「聯合報」的九點六%及「中國時報」 的八點七%。
訊息資料 為何需要收集資料: 從哪裡來的資料 怎麼收集資料 怎麼用數字表徵資料 要收集哪些資料 要收集多少資料~~抽樣囉!!! 資料的範圍 資料的定義 從哪裡來的資料 自己收集的資料或現成資料 資料的來源是否來公正客觀 怎麼收集資料 調查 實驗 怎麼用數字表徵資料 名目資料 有序資料 比例資料 連續資料 靠統計打混可不容易,除了統計和數學以外,還得要有常識。
用數學方法簡化和呈現整體數據 數據計算:平均數、中位數、眾數、變異數、標準差、四分位數、百分位數等等。 數學形式:百分率、成數、折數、整數、小數、分數等等 圖表:一維表格、二維表格、巢狀表格、長條圖、折線圖、圓形圖、意象圖等等。
房市向下冷卻 房價不跌反漲 卻是何故? 鉅亨網編譯郭照青/綜合紐約外電.3月14日 2006 / 03 / 15 星期三 00:06 房市向下冷卻 房價不跌反漲 卻是何故? 鉅亨網編譯郭照青/綜合紐約外電.3月14日 2006 / 03 / 15 星期三 00:06 如果房市正逐漸疲弱,那麼房價卻為何持續上漲? 回答這問題之前,得先複習一下算術。算術是不會騙人的,但是騙子卻會利用算術。每一項統計都總會有個平均數,提到房價,就先得了解,這房價的平均數是如何計算出來的。了解房屋價格的來龍去脈,才有助了解房屋價格是否合理。 首先,所謂平均房價僅是指在特定月份中,已出售房屋的價格,並不代表全國各地的所有房屋價格。更重要的是,每次用以計算房價的房子,也總是不同。 最常使用的平均價格,便是中間價格,亦即在特定月份中,所有出售房子價格的中間點。顯而易見,這中間點的位置,完全是由房屋價格範圍所決定。因而,若高價房屋銷售量多過低價房屋,那麼這項均價便會順勢上移。還有另外一點也不能忽略:猶如新車一般,許多新屋也有標示價格。這項價格只是賣出房子時的價格,完全沒有扣除賣方為了強化賣點,所附加的日用品,傢俱,地氊等的價值。紐約時報於3月4日引述Toll Brothers營建公司執行長的話說:在美國東北部,佛羅里達與加州,許多房價其實較六個月前,還低了5%。 有關平均房價的另外一項質疑,則是新屋有越來越大的趨勢。房屋價格上漲只是反應更多的建材與更廣的空間。美國普查局(Census Bureau)報告便指出,目前平均房屋大小約有2400平方呎,較1990年增加了15%。 最後,當利率上升時,房價較貴的房子脫手的可能性也高出低房價的房子,結果也導致房屋價格上揚。因而房價走勢其實並未抵觸自然法則,反而一切都是順其自然。
資料收集的方法 調查:觀察個體並度量我們感興趣的變數,但並不試圖影響回應。研究目的是描述一群體在此變數的反應。 實驗:刻意對某些個體加上某項處理,以期能夠觀察其反應。研究目的是比較不同的處理是否會使個體有不同的反應。
抽樣~~ 你不必吃完整隻牛,才知道肉是老的 抽樣~~ 你不必吃完整隻牛,才知道肉是老的 設計實驗~~ 隨機的精神,控制的手段 完全隨機化設計(completely randomized) 配對設計 (matched pair design) 區集設計 (block design) 隨機抽樣 簡單隨機抽樣(simple random sampling, SRS): 系統抽樣(systematic sampling) 叢聚抽樣(cluster sampling) 分層抽樣(stratified sampling) 非隨機抽樣 方便抽樣
至於慢性失眠盛行率也是高得嚇人,高達為11.5%,約有250萬人已經到了慢性失眠的地步,也就是說,每七、八人就有一人。需靠藥物才能入眠。 全台內4人就有1個睡不好 480萬人有睡眠問題 女性失眠問題比男性嚴重 【聯合晚報2007.3.20】 一隻羊!兩隻羊!三隻羊!有人睡不著時會數羊,一項針對15歲以上國人的統計發現,國內睡眠問題盛行率高達25.5%,平均每四人就有一人睡不好,480萬人有睡眠問題,很難入睡,只好夜夜數羊! 至於慢性失眠盛行率也是高得嚇人,高達為11.5%,約有250萬人已經到了慢性失眠的地步,也就是說,每七、八人就有一人。需靠藥物才能入眠。 台灣睡眠醫學會今天公佈「國人睡眠品質調查報告」,該項研究以台灣地區15歲以上民眾為抽樣對象,透過電話訪問,有效樣本多達4011人。 結果發現,國內約有兩成五民眾睡不好,超過480萬人有睡眠問題,包括睡眠品質差、易醒、醒了又睡不著等毛病,女性失眠問題比男性嚴重,三成女性不滿意自己的睡眠。 在失眠病患中,又以50至59歲的更年期女性睡眠品質最差,五成一停經女性飽受失眠之苦,兩成女性則會因月經問題而影響睡眠。值得重視的是,480多萬名睡不好的民眾當中,約有250萬人罹患了慢性失眠,以30至59歲族群為主。
簡單隨機抽樣 母體中任一組包含n個個體的樣本,中選的機率都是一樣的 不偏:每一個個體中選的機會一樣 獨立:一個個體中選與否,不影響其他個體是否中選
分層抽樣 把母體依據特性或研究的目的分成幾個性質相同的類組,每個類組稱為一層,每個個體只能屬於其中且唯一的一層。分層後再從各層中簡單隨機抽取樣本(SRS) 。 層內個體性質差異小,層間性質差異大 可依母體各層個體數目之比例,決定各層樣本數 可依母體各層資料變異之比例,決定各層樣本數
部落抽樣 將母體中相鄰的某些個體劃分成一個部落,每個個體只能屬於其中且唯一的一個部落。然後再從所有部落中隨機抽取數個部落,並對部落內的個體進行普查。 常用在地理區域的抽樣 例如:同一年級中抽取數個班級,對班級內所有學生進行普查。班級為部落單位。
系統抽樣 由母體自然隨機排列的個體中,每隔一定間隔選取一個個體,或者先隨機選取一個個體,然後每隔一定間隔選取一個個體。
樣本可靠嗎? 用樣本來估計母體的某些特徵不但不準確,而且不穩定,因為 誤差來源 偏差:可能來自於抽樣誤差也可能來自於非抽樣誤差 變異: 樣本只是母體的一部份(產生誤差) 母體中有很多組相同大小的樣本,會抽到哪一組樣本不知道(產生變異) 誤差來源 抽樣誤差:只要是抽樣就會有誤差 非抽樣誤差 偏差:可能來自於抽樣誤差也可能來自於非抽樣誤差 樣本估計值總是大於母體參數值或總是小於母體參數值 隨機抽樣可以降低偏差 變異: 以母體參數值為中心,所有樣本估計值分散的程度 大樣本和適當的估計方法可以降低變異 低變異產生大誤差的機率小,高變異產生大誤差的機率大。 低偏差誤差分布越對稱,高偏差誤差分布越不對稱。
樣本可靠嗎? 必須面對的現實 誤差=|樣本估計值-母體參數值|<ε 人為的操縱可以避免(非抽樣誤差),但是即使是隨機抽樣,仍無法避免因抽樣所產生的變異和誤差 誤差=|樣本估計值-母體參數值|<ε 抽樣調查中所報告的誤差界限ε為隨機抽樣誤差 統計的目標:誤差越小越好且母體參數落在此誤差範圍內的可能性越高越好
樣本大小的影響 (以簡單隨機抽樣為例) 以民意調查為例,假設母體中同意某議題的人數比例為p ,隨機抽取n個人,
樣本大小的影響 (以簡單隨機抽樣為例)
樣本大小的影響 (以簡單隨機抽樣為例) 利用期望值和變異數的數學方法和性質,我們可以得到 中央極限定理說:隨機從某一母體中抽取n個個體為樣本,則樣本平均數的變動狀況會越來越趨近於常態分配模型 結論: 樣本越大,樣本比例的變異越小 樣本越大,樣本比例的隨機變動模型越對稱
樣本大小的影響 (以簡單隨機抽樣為例)
用樣本估計母體參數有信心嗎? (以簡單隨機抽樣為例) 誤差=|樣本估計值-母體參數值| 在母體參數值未知的情況下,如何描述誤差? 設定誤差界限ε (margin of error),即個人能容忍的誤差範圍,誤差<ε 你對母體參數會落在此誤差範圍內有多少信心?
用樣本估計母體參數有信心嗎? (以簡單隨機抽樣為例) 誤差界限=10cm 你對靶的中心點落在這個範圍內的信心有多高? 誤差界限越大,信心越高 但是希望誤差界限小,而信心高 射靶技術越好,誤差越小 誤差界限越大,信心越高 但是希望誤差界限小,而信心高 樣本比例的變異越小,誤差越小
如何計算母體比例的95%信賴區間?
P的信賴區間估計隨樣本的不同而不同
如何計算母體比例的95%信賴區間? 希望誤差界限小,而信心高 樣本比例的變異越小,誤差界限越小 加大樣本數,那麼95%信賴區間的誤差界限 就可以變小囉~~~ 投擲銅板
如何計算母體比例的95%信賴區間? 需要多大的樣本數,誤差界限就可以控制在0.03呢?
想想~~ 如何計算母體比例的99%信賴區間呢? 如果要控制0.03誤差界限和99%信心水準,需要多少樣本數?
相信調查結果前該問的問題 誰做的調查 母體是什麼 樣本是怎麼選取的 樣本有多大 應答率是多少 用什麼方式聯絡受訪者 調查是什麼時候做的 自由時報 2007/01/10 八成五(樣本比例) 上班族計畫年後轉職年後想轉職的上班族比例(母體比例)介於0.85±0.028的機率有95% 相信調查結果前該問的問題 誰做的調查 母體是什麼 樣本是怎麼選取的 樣本有多大 應答率是多少 用什麼方式聯絡受訪者 調查是什麼時候做的 問題確實是怎麼問的
關於信賴區間的結論 資料必須是從我們關心的母體中所抽出的簡單隨機樣本(SRS)。信賴區間的估計方法是把資料當作SRS在處理。由於實際上常常不可能真的從母體抽SRS,所以結論可能受到挑戰。 母體比例的信賴區間是假設大樣本的情況下,以常態分配作為樣本比例之機率分配模型而得出,因此樣本過小時,需要做修正。 信賴區間只會根據你餵進去的資料來得出結果,它並不幫你檢驗樣本是否適當。
統計的省思~挑戰者號的教訓(1986) In God We Trust: Others Must Have Data (R, Snee) 決定的選擇不只是統計知識, 還包括專業領域的知識、常識和質疑相關訊息的能力。
統計素養 素養 舉凡能夠幫助個人藉由各種形式的語言,如:聽、說、讀、寫等四方面,與他人從事有效的互動,就稱此人具備了基本的素養(David, 1994)。 美國國會通過國家素養法案(National Literacy Act,轉引自Gal & Stoudt,1997-98),其中第三項有關素養的陳述為:「本法案中『素養』是指個人具有讀、寫、說、計算與解決問題的能力,以完成工作和社會所賦予的任務,進而達成個人的目標,並發展個人的知識與潛能。」 統計素養 Wallman(1993)率先強調國民的統計素養,認為統計素養是一種能瞭解且能批判性地評斷遍佈在日常生活中各種統計結果的能力 。 統計素養是有能力解讀出現在報章、雜誌、電視、廣告和與工作相關的任何統計論點 (Lajoie,Jacobs & Lavigne,1995)。 NCTM(2000)數學課程標準中所提到之「解釋統計結果」,指的是要調查媒體及其他消息來源所呈現的統計資料,並辨識和確認那些易讓人誤解的圖表,同時尋找出現在文字陳述中的錯誤來源。 Gal(2002)提出成人統計素養應該包含兩個層面:(a)能解釋和批判在文章脈絡中的統計資訊、與資料相關的議題以及隨機現象;(b)能討論和溝通對資訊意義的認知、資訊內部的意涵、結果的可受性等諸如此類的統計訊息。
統計素養 統計素養模型(Gal, 2004) 統計素養能力應該是資料消費者的能力,而非資料產生者的能力 。 統計素養模型中各個要素並非獨立且固定存在的,而是脈絡相依和動態組合的結果 統計素養能力應該是資料消費者的能力,而非資料產生者的能力 。 知識層面要素 情意層面要素 素養技能 信念和態度 統計知識 評論的立場 數學知識 脈絡知識 評論性的質疑