學科中心 < 信 賴 區 間 試 題 探 討 >
< 信 賴 區 間 > --- 95 暫綱實施前的準備
設常態分配的期望值為m、變異數為s 2,則常態分配的機率分配函數是
標準常態分配 zp p 標準常態分配累積機率表 上面的標準常態累積機率表,是由平均值為 0、標準差為 1 的標準常態分配機率密度函數(上圖中的 f (x)),計算從-∞到 zp 曲線下的面積而得,通常記作F(zp),因此上表可以寫成 F(zp) = p。
信賴區間的實驗 老師為全班每個同學各準備一籤筒,事先不讓學生知道籤筒裡放了幾支籤,內含若干有獎籤,然後做一次實驗:每個同學在籤筒內抽取一支籤,記錄是否為有獎籤後放回,連續抽取 20 次。記錄內容必為下列表格其中一列:
區間公式對照表(n =20)區間半徑 = 舉例:若一學生抽 20 次得到 9 次有獎籤,則中籤比例為 ,區間半徑為 數 中籤比例 區間 半徑 左 端點 右 10 0.50 0.219 0.281 0.719 0.00 0.000 11 0.55 0.218 0.332 0.768 1 0.05 0.096 0.146 12 0.60 0.215 0.385 0.815 2 0.10 0.131 0.231 13 0.65 0.209 0.441 0.859 3 0.15 0.156 0.306 14 0.70 0.201 0.499 0.901 4 0.20 0.175 0.025 0.375 15 0.75 0.190 0.560 0.940 5 0.25 0.060 0.440 16 0.80 0.625 0.975 6 0.30 0.099 0.501 17 0.85 0.694 1.000 7 0.35 0.141 0.559 18 0.90 0.769 8 0.40 0.185 0.615 19 0.95 0.854 9 0.45 0.232 0.668 20 1.00 舉例:若一學生抽 20 次得到 9 次有獎籤,則中籤比例為 ,區間半徑為 區間為[ 0.45-0.218, 0.45+0.218 ],即 [ 0.232, 0.668 ]
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 http://bcs.whfreeman.com/ips4e/cat_010/applets/confidenceinterval.html
信賴區間圖 右圖中,全班 40 個學生每個人都得到一個區間,如果老師事先知道 p = 0.6,那麼從圖中可知,有 35 個區間包含真實的 p 值。 全班 40 個學生包含 p 值區間個數的期望值為 40 0.95 = 38 個 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
以真實中獎機率 0. 6 為例,20 次抽籤抽中有獎籤的比率必為 0, 0. 05, 0. 1, …, 1 以真實中獎機率 0.6 為例,20 次抽籤抽中有獎籤的比率必為 0, 0.05, 0.1, …, 1.0 其中之一,舉例:抽中 9 次的中獎比率為 0.45,此事件發生機率為 ≒ 0.071。(上圖左邊第二條綠色長條) 上圖將每一種中獎比率與其發生機率作成直方圖,而綠色區域是 0.6 前後 1.96 個標準差的區域。
現在用常態分配去近似二項分配,每個同學 20 次抽籤的結果,抽中有獎籤的比率必為圖中 x 坐標之一,且此比率落在綠色區域的機率為 0.95。 每個同學 20 次抽籤抽中有獎籤比率的結果好比是在擲一枚出現正面機率是 0.95 的銅板,成功擲出正面(抽中有獎籤比率落在綠色區域)的機率是 0.95。
若樣本平均 落在 區間內, 那麼區間 會涵蓋真實值 p 。
信賴區間的解讀 全班依照這樣的區間公式求出的 40 個區間,不論 n =20 或 n = 50 的模擬實驗結果,可以發現並非一定有 95% 的區間會涵蓋實際值 p。 全班執行這個實驗,正如 40 個學生每人都在擲一枚出現正面機率為 0.95 的硬幣,我們只知道此實驗出現正面個數的期望值為 40 0.95 = 38 個,並不能保證一定出現 38 個正面。 每個學生做出的區間,只可能有兩種情形:包含真實 p 值,或不包含真實 p 值。因此一旦做出區間後,並不能說「真實 p 值在此區間的機率為 95%」
n = 20 與 n = 50 的區間估計的差異 因區間半徑等於 , 所以較大的 n 值具有較小的區間半徑,也意味著有較佳區間估計的效果。 因區間半徑等於 , 所以較大的 n 值具有較小的區間半徑,也意味著有較佳區間估計的效果。 較大的 n 值會導致此實驗的分配會較近似常態分配。
< 信 賴 區 間 > --- 95 暫綱實施後的練習題
將隨機號碼表中的偶數當成擲銅板出現正面,奇數當成擲銅板出現反面,以此要求全班40個同學每人模擬「投擲一個銅板20次」的試驗,並計算擲出正面的比例及信心水準為95%的信賴區間,其中甲同學作出的區間為[0.328, 0.772],而乙同學作出的區間為[0.556, 0.944],試問下列敘述何者正確? (1)由甲所得到的信賴區間可知,甲模擬投擲銅板20次,得到 11次正面 (2)由乙所得到的信賴區間可知,乙模擬投擲銅板20次,得到 15次正面 (3)由甲所得到95%的信賴區間可知,此區間包含理論值0.5的 機率為0.95 (4)由信心水準為95%可推論,在全班已得到的40個區間裡, 其中包含理論值0.5的區間數等於38個 (5)若全班再做此試驗一次,所得到的40個95%的信賴區間 裡,其中包含理論值0.5的區間個數期望值約為38個 Ans:(1)(2)(5)
某校 1000 人一起做實驗,每個人均從已知籤筒(內有 5 支籤,其中 2 支是有獎籤)抽籤 n 次,每次取出一支籤,取出後須放回。下面第一圖是某次實驗中 n = 50 時,每人抽中有獎籤比率與人數的分佈圖,第二圖則是另一次實驗中 n =100 的分佈圖。試問下列敘述何者正確:
Ans: (1) (2) (3) (4) (5) (1) 兩實驗中,抽中有獎籤比率在 [ 0.28 , 0.52 ] 區間內的學生人數, (2) 兩實驗中,抽中有獎籤比率在 [ 0.38 , 0.42 ] 區間內的學生人數, (3) n = 100 的實驗裡,全校抽中有獎籤比率在 [ 0.31 , 0.49 ] 區間內 的學生數為 950 人。 (4)在 n = 50 的實驗裡,一學生抽中有獎籤比率正好是 0.4 的機率為 。 (5) 若考慮 n = 400 時,一學生抽中有獎籤比率在 [ 0.35 , 0.45 ] 區間 內的機率大於 0.95。 Ans: (1) (2) (3) (4) (5)
(1)在兩實驗中,抽中有獎籤比率在 [ 0.28 , 0.52 ] 區間內的學生人數, 以 n = 100 的實驗裡人數較多。 答:(○) n = 50 的實驗裡,抽中有獎籤比率小於 0.28 的學生數為 15+8+3+1+1 = 28,大於 0.52 的學生數為 15+8+4+2+1 = 30,因此在 0.28~0.52 之間的學生人數為1000-28-30 = 948。同理, n = 100 的實驗裡,在 0.28~0.52 之間的學生人數為1000-2-1-1-3-1-1 = 991。
(2) 兩實驗中,抽中有獎籤比率在 [ 0.38 , 0.42 ] 區間內的學生人數,以 n = 100 的實驗裡人數較多。 答: ( ○ ) n = 50 的實驗裡,抽中有獎籤比率在 0.38~0.42 之間的學生人數為111+115+109 = 335。同理, n = 100 的實驗裡,在 0.38~0.42 之間的學生人數為77+80+81+79+74 = 391,因此 n = 100實驗裡人數較多。
(3) n = 100 的實驗裡,全校抽中有獎籤比率在 [ 0.31 , 0.49 ] 區間內的學生數為 950 人。
(4)在 n = 50 的實驗裡,一學生抽中有獎籤比率正好是 0.4 的機率為 。 答:(○)一學生抽中有獎籤比率正好是 0.4 是指他抽 50 次籤中得有獎籤 20 次,因此這個事件的機率為 。
(5)若考慮 n = 400 時,一學生抽中有獎籤比率在 [ 0.35 , 0.45 ] 區間內的機率大於 0.95。 答:(○) 因 , 抽中有獎籤比率在 0.35~0.45 之間的機率,以常態分配近似此二項分配,這個區間約是期望值前後 2 個標準差,因此機率大於 0.95。
承上題: 若已知信心水準 90% 的區間半徑公式是 (其中 是每人抽中有獎籤的比率),我們將 n = 50 的區間半徑列表如下:(其中區間半徑值是四捨五入至小數點後第四位的近似值)利用下表,每個學生均可做出一個信心水準為 90% 的信賴區間,試問下列敘述何者正確?
(1) 在 n = 50 的實驗裡,抽中有獎籤比率是 0.5 的學生所做出的區間半徑一定大於其他抽中比率的學生做出的區間半徑。 中獎比率 區間半徑 0.02 0.0327 0.22 0.0967 0.42 0.1152 0.62 0.1133 0.82 0.0896 0.04 0.0457 0.24 0.0997 0.44 0.1158 0.64 0.1120 0.84 0.0855 0.06 0.0554 0.26 0.1024 0.46 0.1163 0.66 0.1105 0.86 0.0810 0.08 0.0633 0.28 0.1048 0.48 0.1166 0.68 0.1088 0.88 0.0758 0.10 0.0700 0.30 0.1069 0.50 0.1167 0.70 0.90 0.12 0.32 0.52 0.72 0.92 0.14 0.34 0.54 0.74 0.94 0.16 0.36 0.56 0.76 0.96 0.18 0.38 0.58 0.78 0.98 0.20 0.0933 0.40 0.1143 0.60 0.80 1.00 0.0000 (1) 在 n = 50 的實驗裡,抽中有獎籤比率是 0.5 的學生所做出的區間半徑一定大於其他抽中比率的學生做出的區間半徑。 答:(○)從表中即可看出或由 可看出
(2) 若有一學生抽取 50 次後抽中有獎籤比率是 0. 3,那麼 90% 的信心水準的意義是指,真實中獎機率 0 (2) 若有一學生抽取 50 次後抽中有獎籤比率是 0.3,那麼 90% 的信心水準的意義是指,真實中獎機率 0.4 落在此學生得到的信賴區間內的機率是 0.90。 答:( × )雖然該生所做出的區間為 [ 0.3-0.1069, 0.3+0.1069 ],即[ 0.1931, 0.4069 ],已經知道此區間涵蓋真實的中獎機率 0.4,因此我們不能再說「 0.4 落在此學生得到的信賴區間內的機率是 0.90 」。
(3) 90% 的信心水準的意義是指全校 1000人在 n = 50 的實驗裡,一定會有 900 人的信賴區間涵蓋真實中獎機率 0.4。
(4) 若在 n = 50 的實驗裡要求信心水準提高時,區間長度將隨之增大。 答:(○)要求信心水準提高是指,在期望值前後取更大的區間範圍,才能使抽中有獎籤比率落在此區間的機率變大,這也是說,我們必須將區間半徑增大。舉一例,若信心水準是 95%,區間公式須變為 。
(5)在 n = 100 的實驗裡,因區間半徑 較 n = 50 實驗的區間半徑 小,所以信心水準隨著下降。 答:( × )這是錯誤的觀念,由於這兩個公式都是指期望值前後 1.65 個標準差的範圍,此區域占全部約 90%,因此信心水準均為 90%。
承上題: 從 n = 50 實驗的結果(第一圖)及區間公式表可知,這次實驗每個學生所做信心水準為 90% 的信賴區間可以涵蓋真實中獎機率 0.4 的人數有 個。 答:(890 個)從區間公式表可知,抽中比率是 0.30 的區間為 [ 0.1931, 0.4069 ],抽中比率是 0.50 的區間為 [ 0.3833, 0.6167 ]。再由第一圖知,抽中比率在0.30~ 0.50(含)的人數為 1000-54-56 = 890
機率的發展 機率的概念起源於賭局, 一直到1713 年J.Bernoulli 提出弱大數法則, 標誌著數學機率論的誕生。 接著是 De Moivre (1718年) 與Laplace (1801年) 的中央極限定理 再來是 Gauss 的誤差之常態分配律(1809年)
到了1900年,公理化的時機成熟, Hilbert 提出著名的23個問題, 其中第6個就是關於物理學與機率論的公理化問題。 結果在1933年才由俄國偉大數學家Kolmogorov (1903-1987年) 完成機率論的公理化, 從此機率論作為一個數學理論完全確立。
Jacob Johann Daniel Bernoulli 家族 Bernoulli 大數法則 提出懸鏈線問題 解出懸鏈線問題 解出最速下降曲線問題 Johann 流體力學 Riccati equation Daniel
大 數 法 則 與 二 項 分 配
什 麼 是 大 數 法 則 ? 先介紹柴比雪夫( Chebyshev )不等式: 設隨機變數 X 的期望值為 ,變異數為 ,則對任意 常數 k ( ),恆有 以投擲公正硬幣 n 次的試驗為例,隨機變數 Sn 代表出現 正面的次數,所以 的期望值為 0.5 ,變異數為 ,而 Chebyshev 不等式整理成
取 = 0.1 為例,Chebyshev 不等式成為 而上述式子代表 事實上,當 n = 100 時, 上述近似值是用 Excel 計算得到: S100 /100 p 0.41 0.015869 0.51 0.078029 0.42 0.022292 0.52 0.073527 0.43 0.030069 0.53 0.06659 0.44 0.038953 0.54 0.057958 0.45 0.048474 0.55 0.46 0.56 0.47 0.57 0.48 0.58 0.49 0.59 0.5 0.079589
的二項分配其 Chebyshev 不等式是 亦即對任意給定的正數 , 我們把上式稱為 「當 時,隨機變數 機率收斂 到 0.5」,這種收斂方式對照於函數序列,即為 < fn >在集合 S 上逐點收斂至函數 f 。亦即 對每一個 ,當 ,
逐點收斂的函數序列的例子:考慮 S 是開區間 ( 0, 1 ) , 。 我們可知:對任意 當 時, 還有另一種收斂方式,稱為均勻收斂(uniform convergence):
中 央 極 限 定 理 : 設 X1, … , Xn 是獨立且具相同分配的隨機變數,其中 E(Xi) = m,Var(Xi) = s 2,定義 , 則當 n → ∞ 時,隨機變數 的分配會 趨近於標準常態分配(稱為分配收斂), 也就是說隨機變數 的分配會趨近於標準常態分配
大數法則與中央極限定理的關係: 將隨機變數 整理成 , 由大數法則知 ,當 時 , 此處 符號的意思是指機率收斂: 對任意給定的正數 , 將隨機變數 整理成 , 由大數法則知 ,當 時 , 此處 符號的意思是指機率收斂: 對任意給定的正數 , 而中央極限定理中,乘上 的功能是 讓機率密度函數圖……「撐開來」
「撐開來」 看得更清楚: 中央極限定理中,所謂分配收斂是指 隨機變數 的機率密度函數趨近 標準常態分配 N (0, 1)的機率密度函數, 隨機變數 的機率密度函數趨近 標準常態分配 N (0, 1)的機率密度函數, 逼近
用數學式表示分配收斂 給定任意正數 z ,當 n → ∞ 時, (其中 Φ 是標準常態分配累積機率函數)
中央極限定理的證明: 定義動差生成函數(moment-generating function): 可知
請100位同學每人投擲一個質量均勻銅板二十次的試驗,以擲出正面的比率為橫座標、學生人數為縱座標製作次數分配表。下表是以隨機號碼表得到的100個模擬正面數:
這個隨機模擬的結果有些令人失望,100個同學投擲ㄧ個公正的銅板二十次,出現正面的比率中,人數最高的並不是期望值0 這個隨機模擬的結果有些令人失望,100個同學投擲ㄧ個公正的銅板二十次,出現正面的比率中,人數最高的並不是期望值0.5,而且也沒有出現左右完全對稱的情形。這試驗的期望值是0.5,標準差是 ≒0.11,而我們從前頁的圖表知道,擲出正面比率在0.5-0.11與0.5+0.11之間的人數佔全部的71%,在0.5-0.22與0.5+0.22之間的人數佔全部的95%,在0.5-0.33與0.5+0.33之間的人數佔全部的100%。
如果以100個同學投擲ㄧ個公正銅板的模擬看來,即使並非每個同學擲出正面的比率值都是0 如果以100個同學投擲ㄧ個公正銅板的模擬看來,即使並非每個同學擲出正面的比率值都是0.5(這種情形太困難了吧),但比率值在期望值前後1個、2個、3個標準差範圍內的人數約略是佔全部的68%、95%、99.7%。 這例子與常態分配的理論值有些誤差,想要更近似的方法是每人提高投擲次數(如每人投擲100次)及增加參與學生人數(如1000個學生參與),但隨機試驗仍存在不確定性,我們只是想從這些不確定性中尋找相似性。
在沒有計算機的年代裡,我們連續投擲一個質量均勻銅板10000次,計算出現正面4000~6000次的機率值 就不是件容易的事,數學家想尋找一種模型能夠描繪二項分配或甚至是適用其他的機率分佈,於是常態分佈就廣泛地被大家使用了,只要上述投擲銅板的試驗次數夠多,它就能夠用常態分佈來近似其機率分佈的狀況,這種特別的現象即為統計學中一個重要的定理:中央極限定理。
< 信 賴 區 間 > --- 95 暫綱實施後的首次學測與指考 < 信 賴 區 間 > --- 95 暫綱實施後的首次學測與指考
某廠商委託民調機構在甲、乙兩地調查聽過某項產品的居民佔當地居民之百分比(以下簡稱為「知名度」)。結果如下:在95%信心水準之下,該產品在甲、乙兩地的知名度之信賴區間分別為 [ 0.50, 0.58 ]、[ 0.08, 0.16 ]。試問下列哪些選項是正確的? (1)甲地本次的參訪者中,54%的人聽過該產品 (2)此次民調在乙地的參訪人數少於在甲地的參訪人數 (3)此次調查結果可解讀為:甲地全體居民中有一半以 上的人聽過該產品的機率大於95% (4)若在乙地以同樣方式進行多次民調,所得知名度有 95%的機會落在區間[ 0.08 , 0.16 ] (5)經密集廣告宣傳後,在乙地再次進行民調,並增加 參訪人數達原人數的四倍,則在95%信心水準之下 該產品的知名度之信賴區間寬度會減半(即0.04) Ans:(1)(2)
國一學生30萬人,智商測驗的結果是「平均數100,標準差15」的常態分配。若以智商130以上做為甄選國一學生為資優生的門檻,則根據這次測驗的結果判斷下列選項中的敘述,哪些是正確的? (1) 約有5%的國一學生通過資優生甄選門檻 (2) 約有15萬名國一學生的智商在100以上 (3) 超過20萬名國一學生智商介於85至115之間 (4) 隨機抽出1000名國一學生,可期望有25名資 優生 (5) 如果某偏遠學校只有14名的國一學生,那麼 該校不會有資優生 Ans:(2)(3)(4)
某縣市教育局欲瞭解高中生參加課外活動社團的意願,開學日隨機調查高一、高二、高三學生各1067名,詢問本學期是否要參加課外活動社團。已知該縣市的高一、高二、高三學生人數幾乎一樣多,各年級學生調查結果如下圖: 試問下列選項中的敘述,哪些是正確的? (1)學生要參加課外活動社團之比例隨著年級增加而遞減 (2)由上述資訊可以估算全體學生要參加課外活動社團的比例 (3)在95%信心水準下,每一個年級學生要參加課外活動社團的比例之信賴 區間,都可以由題目中已知的數據算出 (4)在95%信心水準下,三個年級的調查結果,以高一學生要參加課外活動 社團的比例的信賴區間最長 (5)在95%信心水準下,三個年級的調查結果,以高三學生要參加課外活動 社團的比例的信賴區間最短 Ans:(1)(2)(3)(5)
< 信 賴 區 間 > --- 現況與未來
某次測驗有單選題100題,每題有5個選項,答對得1分,不答與答錯均不得分不倒扣。請依此回答下列兩個多重選擇題: 1. 假設小明決定每題均亂猜答案,試問 下列敘述何者正確? (1) 小明得分的期望值為20分 (2) 小明得到20分的機率大於得到21分的機率 (3) 小明得到19分的機率等於得到21分的機率 (4) 小明得到16~24分的機率約等於0.95 (5) 若只用前50題計分,每題答對得2分答錯不倒扣,則小明得分的期望值是40分 Ans:(1)(2)
2. 現在有五個同學相約考試時每題都亂猜答案,但彼此不知是否真的均遵守約定亂猜答案,得分如下: 學生 甲 乙 丙 丁 戊 分數 30 24 12 16 28 老師建立下面的規則來判斷是否真的完全亂猜答案:作答者以每人答對比例為中心,做一個95%的信賴區間;若區間涵蓋0.2,我們就相信作答者真的是亂猜答案,若區間不涵蓋0.2,則否。試問我們相信遵守約定亂猜答案的同學是 (1)甲 (2)乙 (3)丙 (4)丁 (5)戊 註:95%的信賴區間是指 Ans:(2)(4)(5)
民意調查的意義 常常在民意調查的報導中有如下的敘述: 本項調查是由XX民意調查中心在XX年X月X日進行,以隨機跳號抽樣及電腦輔助電話訪問方式,訪問台灣地區 1068 位 20 歲以上的民眾,在 95% 的信心水準下抽樣誤差為 ± 3%。
如果這項調查的結果對於候選人A的支持度為32%,候選人B的支持度為30%,這代表候選人A支持度的95%信賴區間為[29%, 35%],候選人B支持度的95%信賴區間為[27%, 33%]。這兩個區間有很大的重疊,因此選舉結果是有可能發生逆轉,這也是在相同的信心水準下,為何信賴區間的長度(即所謂抽樣誤差)要越小越好,而上面已提供了一個方法—— 提高抽樣的樣本數 n。
如何得到民意調查的抽樣數 n = 1068? 因 ,所以區間半徑 。若要求抽樣誤差不超過 d,則 即 。 因 ,所以區間半徑 。若要求抽樣誤差不超過 d,則 即 。 以此例而言,若選擇抽樣誤差 d 等於 0.03,因 95% 的信心水準下, z0.975 ≒ 1.96,則 n 1068。
但在相同的信心水準下,若選擇抽樣誤差 d 小於 0 但在相同的信心水準下,若選擇抽樣誤差 d 小於 0.01,則 n 9604 。以成本的角度來看,為了讓抽樣誤差從 3% 減少到 1%,與其增加 9 倍的樣本,不如更謹慎的規劃及更好的抽樣方法來得有效。
< 信 賴 區 間 > --- 批判與討論
Bye Bye