生活中的統計 師大數學系 蔡蓉青 93.11
大綱 總說: 統計是什麼? 生活中的統計 敘述統計 推論統計 實驗設計 中學的統計 統計的一天 結語
統計是什麼? 從數據中獲取資訊的科學(Moore, 1997) 粗分 生活中的統計 中學的統計 敘述統計: 圖表, 統計量 推論統計: 估計, 檢定 實驗設計 生活中的統計 民調, 股市預測, 新藥測試, … 中學的統計 隨機變數, 期望值,敘述統計, (估計量及其信賴區間)
生活中的統計1.1 敘述統計:圖表 例子: 班上這次段考成績分布
生活中的統計1.2 敘述統計:統計量 例1: 班上這次段考成績 例2:奧運跳水計分: trimmed mean Mean 70.34 Median 74.00 Std. Deviation 18.68 Minimum 24 Maximum 98 例2:奧運跳水計分: trimmed mean
生活中的統計2.1 推論統計:估計 2.1.1 估計母群體參數 (parameters) 例1: 年底選舉選民會投票給某候選人之比例p 例3: 新買的TOYOTA汽車平均1公升可以跑多少公里?
生活中的統計2.1 推論統計:估計 2.1.2 估計母群體分配(distribution) 例1: 常模的建立 判斷是否為過動兒 我這樣算不算太胖? 例2: 電腦鍵盤上的字母之排列順序 例3: 政策: 健保給藥規則
生活中的統計2.1 推論統計:估計 2.1.3估計關聯性 (association, correlation) 例1: 估計身高與體重之間的關聯 例2: 股市預測 股市行情與台幣升值的關聯 昨天股市與今天股市的關聯 例3: 基因體之型態與遺傳病的關聯
生活中的統計2.1 推論統計:估計 2.1.4 估計效果 (effect) 例1: 新的教學法對學生學習成效的影響 例2: 餐廳禁煙後對生意的影響 例3: 網路分級對青少年沉迷網站的影響
生活中的統計2.2 推論統計:檢定 2.2.1 檢定母群體參數 (parameters) 例1: 現在的學生程度有比較差嗎? 例2: 現在的小學生有過胖嗎? 例3: 樂透真的每個號碼出現的機率都相等嗎?
生活中的統計2.2 推論統計:檢定 2.2.2 檢定母群體分配(distribution) 例1: 學生成就測驗真的是呈現常態分配嗎? 例2: 這個骰子是公正的嗎? 例3: 開車上班所花的時間是呈現常態分配嗎?
生活中的統計2.2 推論統計:檢定 2.2.3 檢定關聯性 (association, correlation) 例1: 收入與性別是否有關聯? (相關因果) 例2: 手機之使用頻率是否與腦癌之發生有關聯? 例3: 吸煙與肺癌是否有關聯? (因果?)
生活中的統計2.2 推論統計:檢定 2.2.4 檢定效果 (effect) 例1: 新藥測試 例2: 多吃銀杏可以減少罹患失智症的風險嗎? 例3: 多元入學減輕學生的壓力了嗎?
生活中的統計3 實驗設計 如何抽樣? 什麼樣的資料? 實驗怎麼樣操弄? More… Cross-Sectional Matching Longitudinal 實驗怎麼樣操弄? Nested design Block design Latin square design More…
中學的統計 認識什麼叫做隨機變數? 了解期望值的意義 敘述統計 抽樣方法 推論統計的加入—估計? What else?
認識什麼叫做隨機變數 能舉例 能從實驗去推隨機變數的機率(應該蠻有趣的..) 二項式分配(n,p) 幾何分配(p) 負二項分配(k,p) More….(以離散型隨機變數為主)
了解期望值的意義 加權平均的概念: 權=P(X=x) .
了解期望值的意義 怎麼解釋期望值? 透過例子: X~幾何分配(p), E(X)=1/p 區別期望值與樣本平均
進入推論統計—估計 母群體(population)與樣本(sample)的概念 認識參數(parameter)與統計量(statistic)之差異 估計在做什麼? 計算簡單而直覺的參數估計量 銅板出現正面之機率, 年底選舉選民會投票給某候選人之比例 抽樣分布的概念 信賴區間
抽樣分布 (sampling distribution) 統計量的抽樣分布(sampling distribution of a statistic) 所謂估計量的標準誤:該統計量的抽樣分布之標準差 (估計值的標準誤:該統計量的抽樣分布之標準差的估計值) 例子 樣本平均數的抽樣分布,變異數的抽樣分布, 中位數的抽樣分布, etc.. 抽樣分布做什麼用? 知道怎麼樣的樣本統計值是合理或太極端了,用來做參數估計的信賴區間
除以N還是N-1? 變異數
了解信賴區間的意義 例子:年底選舉選民會投票給某候選人之 比例p之95%信賴區間 點估計: 區間估計: 一般電視上給的95%信賴區間:
信賴區間的95%代表什麼? 95%的這樣的區間包含p這個參數 區間是變數, p是固定的 P(參數包含在95%信賴區間中)=0.95 我們一般利用樣本只得到其中一個95%信賴區間,它有沒有包含參數就不得而知了 p
統計的一天
結語 生活中充滿統計,所以數學的生活化 If possible, make it fun! => 敘述統計(圖表)之重視 推論統計(估計)加入中學數學 If possible, make it fun!
謝謝! 向各位推薦: 九十四年全國教師福智成長營 營隊時間: 94.1.26~94.1.31 http://slow.ccu.edu.tw/teacher/ 報名期間: 即日起至 93 年 11 月 20 日
為什麼6:30am起床? 公車,捷運班次多寡之安排 (估計) 上班所花時間平均: 57 min (參數估計) 上班所花時間分配 (分配估計)
當選勝算? 布希 vs 凱瑞 上次高雄市長選舉 Q:如果明天就要投票選市長,而參選的人只有謝長廷、張博雅和施明德,請問在這三個人選當中,您比較會投給哪一位候選人? 調查結果(817位): 謝長廷(47%)、張博雅(30%) 、施明德(8%) 、 其他人選(1%) 、尚未決定(14%) 謝長廷得票率之95%信賴區間: 真正選舉時謝長廷得票: 50.04%
健康資訊 多吃銀杏可以減少罹患失智症的風險? 某新藥有效嗎? SPA真的可以消除疲勞嗎? More… 臨床實驗, Matching取樣, 迴歸分析 某新藥有效嗎? 臨床實驗, 存活分析 SPA真的可以消除疲勞嗎? 實驗設計, pre-post More…
運動 什麼樣的運動? 多久? 打太極拳與平衡感之關聯(變異數分析, 關聯性模型) 瑜珈與身體狀況之關聯(變異數分析, 關聯性模型) 運動時間與體能狀況的關聯(迴歸分析) 運動時間與體重之間的關聯(迴歸分析)
什麼會考? 歷屆聯考題型分析 歷屆聯考題型分析 各單元出題比例 (估計) 題目之分類 (聚落分析) 每年之變化(趨勢分析) More…
消遣娛樂,興趣嗜好 看電視:看什麼節目呢? 看書:看什麼書呢? More… 收視率指數(抽樣調查,民調) 10大暢銷書排行榜 (順序統計量,敘述統計) More…
柴米油鹽醬醋茶 保費繳了沒? 安排寒假出國去玩的行程和買機票 小女兒3歲了要不要開始上英文雙語幼稚園? 保險公司保費的計算 (精算) AA機票預售超出機位(估計有多少搭不上或取消者,計算期望損益) 小女兒3歲了要不要開始上英文雙語幼稚園? 有關開始學習英文之年齡與學習成就之間關聯有關的報導(迴歸分析)
有關睡眠 睡多久最好? 什麼睡姿比較好? 睡什麼床對身體比較好? 睡眠時數與隔天精神狀況之間的關聯(迴歸分析) 不同睡姿與睡眠品質的關聯(變異數分析,關聯性模型) 睡什麼床對身體比較好? 不同的床與身體舒適度的關聯(變異數分析,關聯性模型)
股市分析 觀察季節性, 週期性 (時間序列)