談高中的機率與統計教育 黃文璋 國立高雄大學應用數學系 101年9月15日 於中央研究院數學研究所 數學教育新進人員工作坊 談高中的機率與統計教育 黃文璋 國立高雄大學應用數學系 101年9月15日 於中央研究院數學研究所 數學教育新進人員工作坊
高中引進機率與統計的目的 了解隨機的概念。 學到一些生活上常會用到的統計。 從其中學到一些數學。
普通高級中學必修科目數學課程綱要 高一下處理有關離散量的課題,包括數列與級 數、排列組合、生活中常見的古典機率,以及其 他學科常用到的數據分析等。 1.一維數據分析 1.1 平均數、標 準差、數據 標準化 1.1 2.二維數據分析 2.1 散佈圖、相 關係數、最 小平方法 2.1 只談母體數據分 析,不涉及抽樣, 可用計算工具操作 可用計算工具操 作。最小平方法的 證明置於附錄
普通高級中學選修科目數學課程綱要 數學甲I、4學分 主題 子題 內容 備註 一、機率統 計Ⅱ 隨機的意義 二項分布 抽樣與統計推論 1.1 隨機的意義 1.2期望值、變異數、標 準差 2.1獨立事件、重複試 驗、二項分布、二項分 布的性質 3.1抽樣方法:簡單隨機 抽樣 3.2 亂數表 3.3常態分布、信賴區間 與信心水準的解讀 3.1 不含系 統抽樣、 部落抽樣
說明與範例 一、機率統計II 對於機率與統計而言,重點在讓學生了解隨機 的本質,並能學到估計的概念,而不只是學到 數學的計算。各種概念產生的背後原因,如機 率的性質,期望值、變異數及信賴區間等,更 應闡釋清楚。…高中課程只處理離散型的隨機變數。
3.3 常態分布、信賴區間與信心水準的解讀 高中程度的統計推論只做隨機變數期望值的估 計,它的背後理論是中央極限定理。要介紹中 央極限定理,就需要引入常態分布。此部分僅 做通識性的介紹,以活動方式建立學生對於中 央極限定理的直觀。 對一固定的信心水準,給出信賴區間公式,再 讓學生以亂數表模擬或實驗投擲正面出現機率 為p的銅板n次,代入信賴區間公式,以說明信 心水準的意涵;並以此解讀,何以大多數的學 生所得的信賴區間都會涵蓋p?
什麼是通識性? 聽到通識,你想到什麼? 前述解讀正確否? 7
交叉分析在高中 因民調裡常有交叉分析,似乎是一該會的概念。 95年版高中數學課綱因此引進此題材。 統計深耕? 8
某版高中選修數學(I),交叉分析之例。 9
10
11
個名額中,有近半名額9位為女生,寫下歷史紀 錄。台大教務長表示,女生錄取比例增加是剛 好,台大招生的立場,向來就是找最適合、最有 對隨機現象,人們平常理解誤差的存在。 99年4月19日,台大公布甄選榜單,報載醫學系20 個名額中,有近半名額9位為女生,寫下歷史紀 錄。台大教務長表示,女生錄取比例增加是剛 好,台大招生的立場,向來就是找最適合、最有 能力的學生,不會考慮學生性別。 只要近半,並不需女生錄取正好一半,才認定未 考慮學生性別: 此講法正確否? 12
應由各性別的錄取率,而非由各性別的錄取人 數,來判定兩性錄取是否有異。 13
由男女錄取率的相等與否,來判定錄取與男女性 別是否有關,並不正確。 這非統計思維。除非事先設定男女錄取率一定要 必須指出: 由男女錄取率的相等與否,來判定錄取與男女性 別是否有關,並不正確。 這非統計思維。除非事先設定男女錄取率一定要 相同(這時男女錄取標準,就很難相同),否則即 使用抽籤(這時錄取與否總該跟性別無關),來決 定錄取名單,都不能保證抽出的男女錄取率相 同。 14
既講不清楚,也無法讓學生學到任何正確統計概 念的交叉分析,怎會放進高中數學? 15
一方面是統計被過度推崇。 一方面是統計深度被低估。 幸好九九課綱拿掉了。 16
課綱為何常改? 在統計裡現況是被保護的,不輕易推翻。 H0:現況 H1:傾向接受 朝令有錯夕改何妨非統計精神。 17
信賴區間進入高中 民國95年後入學的高中生,高二下的數學,便有中 央極限定理,及信賴區間。 99年後入學,中央極限定理及信賴區間,移至高三 上。 放高二下與高三上之差別為何? 18
高中為什麼要敎中央極限定理? 是因為中央極限定理很重要嗎? 19
為了近似,先介紹中央極限定理,且僅考慮最簡單 的情況,即伯努力分佈,及相關的二項分佈。 以民調當應用,因引入民調裡的信賴區間,才是介 紹中央極限定理之主要目的。 民調的取樣,為簡單隨機抽樣,即取出後不放回。 取出後不放回,取出的樣本便不獨立。此時涉及超 幾何分佈,而非二項分佈。 如何講清楚為什麼中央極限定理仍適用? 高中數學課本,寫到這裡,彆扭不產生也難。 或不講原因,讓細心的學生充滿疑慮;或講得一團混亂,製造出更多困擾。 20
困擾一 曾有教科書說: 當母群體中每一元素被抽中的機會均等時, 從母群體中隨機抽取所需樣本的方法,稱為 簡單隨機抽樣法。 底下為另一說法: 設母體個數為N,從中抽取n個樣本,則每一 個體被抽到的機率都是n/N,此種抽樣法稱 為 二講法乃類似,只是皆不正確。 21
正確的定義是: 假設欲自有N個元素的母體中,抽取n個樣 本,若母體那 個有n個元素的子集合,皆 有相同的機率被取中,則此法稱為簡單隨機 抽樣法。 22
反例 假設母體中有a,b,c,d四個元素,要抽取兩個樣 本。即N = 4,n = 2。 各以1/2的機率取{a,b},及{c,d}。 則母體中的四元素,每一被取中的機率皆為2/4 = 1/2,符合前述課本上的要求。 23
困擾二 n很大時,樣本平均 : 弱大數法則? 教科書中有下述講法: 機率裡的期望值就是統計試驗中大量數據 的平均值。 n很大時, 必很小? 24
正確的說法: n很大時, 很小的機率很大。 25
困擾三 有些教科書說: 分佈曲線都是呈現單一高峰的左右對稱曲 線,這種曲線稱為 常態曲線。 26
亦有教科書說: 對一組數據畫其直方圖後,若將每個長條頂 端中點以折線連接會有很多種不同的式樣, 但最後看到的是中間高而往左右兩邊下降, 近似鐘形。 27
即使左右對稱都不見得是常態分佈,何況很多數 據連左右對稱都不是,當然更不會有什麼近似鐘 形: 對常態分佈,及鐘形乃過度推崇。 此問題稍後再討論。 28
考試引導教學,學測及指考,究竟考些什麼統計 題目? 29
機率統計考題探討 98年指考數學乙選擇題第4題(多選) 某縣市國一學生30萬人,智商測驗的結果是「平 均數100,標準差15」的常態分配。若以智商130 以上做為甄選國一學生為資優生的門檻,則根據 這次測驗的結果判斷下列選項中的敘述,哪些是 正確的? 30
(1) (2) (3) (4) (5) 約有5%的國一學生通過資優生甄選門檻 約有15萬名國一學生的智商在100以上 超過20萬名國一學生智商介於85至115之間 隨機抽出1000名國一學生,可期望有25名資優 生 如果某偏遠學校只有14名的國一學生,那麼該 校不會有資優生
大考中心公佈的答案為(2)、(3)、(4)
討論 文字該斟酌。 問: 可期望得到點數3.5? 期望值之意義明確,等同於可期望? 可期望一詞,乃生活用語。
智商測驗成績為離散值,常態分配為連續型,離散 型怎會變成連續型? 測驗的結果,只能以常態分配當近似的模型,而非 就是常態分配。
一般初等機率統計書(如Walpole et al. (2011)p.187) 的寫法: 1. If the wages are approximately normally distributed and paid to the nearest cent, … 2. The weights of a large number of miniature poodles are approximately normally distributed with a mean of 8 kilograms and a standard deviation of 0.9 kilograms. 3. The IQs of 600 applicants to a certain college are approximately normally distributed with a mean of 115 and a standard deviation of 12.
選項(3) 尚有一問題。高中數學引進常態分佈,乃 為了信賴區間,且將信心水準取為95%。由N(0,1) 分佈的機率值表,得介於正負1.96之間的機率約 為0.95。 課本將1.96以2替代,導致對常態分佈,取值較平 均數高兩個標準差以上的機率,以0.025視之。實 際上此機率約為0.0228。 故隨機抽取1000名國一學生,其中資優生人數之 期望值約為22.8,而非25。 問何者正確,25絕非正確。 問題:π= 3.14是否正確?
PISA考題 PISA(the Programme for International Student Assessment,國際學生能力評量計畫,台灣受測學 生包含國中、五專及高中職)2006數學樣本試題 M179。
問題:搶劫 電視主播呈現了下圖並報導: 「從圖表顯示, 從1998年到1999年搶劫案數量有巨幅的上升」。 你認為這位主播對於上圖的解釋是否合理?請寫 出一個理由來支持你的答案
滿分 代號21:不,不合理。指出我們看到的只是整個圖 表的其中一小部分。 不合理,須顯示整個圖表。 我不認為那是合理的詮釋,因為如果顯示全圖的 話,便能看到搶劫案的數目只是輕微上升。 不合理,因為他只用了圖表上方的小部分。如果看 到全圖由0到520的情況,便知道上升幅度不是那麼 大。 不,那只是因為該圖表讓人覺得數字巨幅上升。看 數字增加並不多。
討論 到底搶劫案上升能不能算巨幅,並非只看增加的 搶劫案數值之大小,也宜看發生機率之大小。給 一情境如下: 假設每年搶劫案之數量X有B(520,0.977)分佈。令 n = 520,p = 0.977。則
因np及n(1 - p)皆大於5,由常態近似,得 在統計裡,一件事是否夠顯著,乃依發生機率之 大小。 在上述假設下,0.0209的機率算是夠小,所以該 主播之解釋並無不妥。 男子100公尺短跑的世界紀錄,若進步0.1秒,將 是巨幅提昇: 1968年紀錄為9.95秒,2009年則為9.58秒,每 10年平均快不到0.1秒。
高中教師的困擾 在一篇機率或信心Q&A的文章 在某一次教師研習的綜合座談中,有老師提到以 下的問題: 投擲1只骰子(傳統6面骰字,點數1, 2, 3, 4, 5, 6,點數1, 4為紅色,其他點數為黑色),擲出 1點的機率為何?若已知擲出的顏色為紅色, 請問擲出1點的機率為何? 42
這個問題在學生沒有學過信賴區間與信心水準之 前是沒有疑義的,還沒有擲出骰子前,擲出1點的 機率是1/6;在擲出的顏色為紅色的條件下,擲出 1點的機率為1/2。但學生學過信賴區間之後會 說,不,老師,既然骰子已擲出,則骰子是1點的 機率不是1就是0,不會是1/2或其他任何數字。 結果,學得越好的學生心中的疑惑卻越深。我們 該如何回應這個學生?在條件機率的情境下,應 該使用機率或信心? 43
擲一個公正骰子一次,出現一點的機率=1/6。 這是由大數法則得到的,故以機率稱之。擲一 個公正骰子一次,在已知出現紅色點數的條件 Q&A作者如下回答: 擲一個公正骰子一次,出現一點的機率=1/6。 這是由大數法則得到的,故以機率稱之。擲一 個公正骰子一次,在已知出現紅色點數的條件 下,出現一點的機率=1/2。這是由大數法則得 到的,故仍以機率稱之。 44
在中學裡介紹中央極限定理,大抵僅針對二項分 佈,底下為一些講法: 在參數是(n,p)的二項分布中,當試驗的次數n足夠 大時,成功次數X的機率分布會近似於平均數μ 為np,標準差σ為 的常態分布。 當n足夠大時,二項分配的圖形近似一平滑的鐘形 曲線,此時二項分配近似於常態分配。 45
可看出當n=32而p=0.5時,二項分配機率圖是對稱 且呈鐘形,接近常態分配。…事實上,對任意 0<p<1,由中央極限定理可知:n夠大時,X會接 近常態分配。 的相對次數直方圖長相非常接近鐘形。 n夠大,隨機變數 = X/n近似常態分布,其平均數 μ= p,標準差σ= ,…。 當樣本數n夠大時, 的分佈會趨近於平均數為 p,標準差為 的常態分佈。 46
這些都不太正確 所謂n足夠大,當然包含n無止盡地增大。 對B(n,p)分佈,不論p為何,n愈大時,Sn將很可能 也是很大。 又n →∞時,Sn /n機率收斂至p。 因此說,n夠大時, Sn及Sn /n會分別近似那一常態 分佈,都非正確。 47
隨著n之增大,B(n,p)分佈之直方圖,將愈趨貼近 水平座標軸(想想最大高度趨近0),怎會近似鐘形 曲線? 至於n很大時,Sn/n的直方圖,將如底部中點為p之 ㄧ座尖塔,高聳入雲,也絕不會讓人聯想到鐘形 曲線或常態分佈。 48
Sn有B(n,0.5)分佈 0.0079786 圖7. Sn之直方圖, n =10,000 49
Sn有B(n,0.5)分佈 79.786 圖8. Sn /n之直方圖, n = 10,000 50
近似不能僅靠目測 圖9. B(100,0.5), Logistic( ) 51
Logistic(μ,s) 52
Student's t-distribution Wikipedia: Student's t-distribution The t-distribution is symmetric and bell-shaped, like the normal distribution, but has heavier tails, meaning that it is more prone to producing values that fall far from its mean. The overall shape of the probability density function of the t-distribution resembles the bell shape of a normally distri- buted variable with mean 0 and variance 1, except that it is a bit lower and wider. As the number of degrees of freedom grows, the t-distribution approaches the normal distribution with mean 0 and variance 1.
分佈之p.d.f. N(0,1)分佈之p.d.f. 二函數差異極大!
分佈(紅色)與N(0,1)分佈(藍色)p.d.f圖形之比
1 degree of freedom 2 degree of freedom
3 degree of freedom 5 degree of freedom
10 degree of freedom 30 degree of freedom
很多分佈其機率密度函數均類似鐘形(左右對稱, 由最高的中間往左右兩側下降),但並非皆為常態 分佈。
數學庶民化歷史已久,概念已較清晰,機率與統 計進入中學數學的時間尚短。 高中數學究竟該包含那些機率與統計的題材,該 如何呈現內容,及該如何教學,都仍有待探討。
謝謝各位!
例. 設一班有40位同學,給定一p。 每位同學各自以亂數表,模擬投擲銅板,各得一銅板出現正面機率p之95%信賴區間。
解. 會涵蓋p的區間數以X表之。 取樣前,每一信賴區間有0.95之機率會涵蓋p。 40個信賴區間,有幾個涵蓋p,相當於獨立地做某 實驗40次,每次成功機率皆為0.95,求成功幾次。 X有二項分佈,參數為40,0.95。
由表1,40個95%信賴區間中,至少有4個 (即X≦36)不涵蓋p之機率約為0.13815。 假設某校高二有25個班,每班設有40人。 若每班皆做此模擬實驗,則全年級全班所 得信賴區間,至少有4個不涵蓋p之班級 數,約有B(25,0.13815)分佈。 平均約25×0.13815 ~ 3.45375 (班)
假設全台高二共有2,500班(每班仍設為40人), 每班都做此實驗。 P(X≦33) ~ 0.00339 2,500×0.00339 ~ 8.475(班) 全台平均約有8個班,全班所得信賴區間,至 少有7(=40-33)個不涵蓋p。這幾班會認為大多 數同學所得的信賴區間會涵蓋p?
p之90%的信賴區間?
由表1,對B(40, 0.90)分佈, P(X≦32) ~ 0.04190。 故一校之全年級(設有25班),約有 25×0.04190 ~ 1.0475(班), 至少有8個信賴區間沒有涵蓋p。 全台約104班。98課綱說: 顯然並不恰當。 大多數同學所得的信賴區間會涵蓋p,