第七章 假設檢定
學習重點 解釋假設檢定的重要性 描述抽樣在假設檢定的角色 確認型Ⅰ與型Ⅱ錯誤,並且討論它們之間的衝突 解讀信心水準、顯著水準及檢定力 計算並解讀 p-值 針對某一項假設檢定決定樣本數與顯著水準 利用樣板算 p-值 利用樣板繪製檢定力曲線與操作特徵曲線
虛無假設 虛無假設 (null hypothesis) 是進行假設檢定的第一步。 虛無假設是某種有關母體參數值的主張。它是一項被認為正確的主張,直到我們有充分的統計證據顯示此主張是錯的。
虛無假設 例如:某項虛無假設可能主張某個母體平均等於 100,除非我們獲得母體平均不是 100 的充分證據,否則我們將接受該項主張。 此虛無假設記作: H0: μ= 100
對立假設 對立假設是虛無假設的反面。 以 H1 表示對立假設,因為虛無假設與對立假設是完全對立的主張,所以只有其中一項主張可以是正確的。
假設檢定的觀念 收集證據 寫出虛無與對立假設之後,接著就是收集證據 最好的證據是不帶任何不確定的數據
假設檢定的觀念 型 I 與型 II 錯誤 在統計假設檢定的範圍內,拒絕一項正確的虛無假設被認定是型Ⅰ錯誤 (typeⅠ error) 。
假設檢定的觀念
舉例:一樁搶案 1964/6/18一婦女遇上搶劫,後來警方逮捕Janet Collins,但並無直接證據。 一名數學老師的證詞定了Janet Collins的罪: H0: Janet Collins 無罪 H1: Janet Collins 有罪 根據目擊者證詞發生:金髮女性、開一輛黃色車子、與一位非裔男子 同行、該男子蓄鬍的機率為1/12000000, 故若選擇H1而發生錯誤的機率為1/12000000 但每一項事件的機率從何來?將這些機率相乘必須要事件相互獨立
假設檢定的觀念 p-值 已知一項虛無假設,及樣本數為 n 的樣本證據,p-值是在相同樣本數且虛無假設確實為對的情形下,得到一組不利或更不利於虛無假設之證據的機率。我們在懷疑 H0 會帶來最大好處 (即最大可信度) 的情形下計算 p-值。
假設檢定的觀念 顯著水準 統計檢定最常見的策略是,設定一種記作α的顯著水準 (significance level) 。 當 p-小於α,就拒絕 H0。
假設檢定的觀念 顯著水準中,拒絕一項虛無假設 如果沒有拒絕 H0 並不能證明 H0 是正確的 α 是我們設定的最大型 I 錯誤機率 α 的選擇間決定型 II 錯誤的機率
假設檢定的觀念 最佳α值及型Ⅰ與型Ⅱ錯誤間的妥協 這種情形下,我們應該努力降低型Ⅱ錯誤的機率,而不是型Ⅰ錯誤的機率。在這種型Ⅱ錯誤的成本比較高的情形下,我們會設定較高的α值,如 10%。若螺釘只是用來結合垃圾桶的表面,此時型Ⅱ錯誤的成本不高,那麼我們應該努力降低型Ⅰ錯誤的機率,而非型Ⅱ錯誤的機率。在這種型Ⅰ錯誤的成本比較高的情形下,我們會設定較低的α值,如 1%。
假設檢定的觀念
假設檢定的觀念 β及檢定力 β 是用來代表型Ⅱ錯誤機率的符號 β 和我們檢視的參數值、樣本數及α有關 β 的反面 (1-β) 即是檢定力 某個檢定的檢定力是檢定程序能找出錯誤虛無假設的機率
假設檢定的觀念
計算 p-值 檢定統計量 考慮以下情形 藉由計算 P-value=P(X-bar<=999/ >=1000)
計算 p-值 計算 p-值 再次考慮以下情形 假設母體標準差是 5,樣本數是 100,則 P-value=P(X-bar<=999/ >=1000)
計算 p-值
計算 p-值
計算 p-值 左尾檢定 (left-tailed test) : 拒絕發生在檢定統計量分配的左尾。
計算 p-值 右尾檢定 (right-tailed test) : 拒絕發生在檢定統計量分配的右尾。
計算 p-值 雙尾檢定 (two-tailed test) : 拒絕發生在雙尾的任何一邊。
計算 p-值 計算 β 考慮以下情形 看圖 7-8,H0 會被拒絕,只要 小於以下的臨界值
計算 p-值
計算 p-值 當μ= μ1, 服從平均μ1 圖 7-9 顯示以下右尾檢定一張類似的圖形
計算 p-值
計算 p-值 圖 7-10 顯示以下雙尾檢定的β值
計算 p-值
假設檢定 三種最常見的假設檢定 1. 關於母體平均的假設檢定 2. 關於母體比例的假設檢定 3. 關於母體變異數的假設檢定
假設檢定 檢定母體平均 檢定統計量為 Z 的情形: 計算 Z 的公式 1. σ已知,且母體是常態 1. σ已知,且母體是常態 2. σ已知,且樣本數至少是 30 (母體不見得是常 態) 計算 Z 的公式
假設檢定 檢定統計量為 t 的情形: 母體是常態而且σ未知,但是樣本標準差 S 已知。 這個數值會服從自由度是 n-1 的 t 分配。
假設檢定 無法利用 Z 或 t 檢定統計量的情形 母體並非常態且σ未知。 母體並非常態,且樣本數低於 30。 母體是常態且σ未知。抽樣只提供樣本平均 ,而非樣本標準差 S。另外也不提供樣本數據,因此也無從計算 S (這種情形明顯較少)。
假設檢定 樣板
假設檢定
假設檢定 檢定母體比例 用二項分配的時機: 可以用二項分配計算二項機率,表示某些樣本數 n 及母體比例 p 的結果已被製成表格。如果利用速算表樣板計算機率,500 以內的樣本數都辦得到。 用常態近似法的時機: 當樣本數 n 太大 (大於 500) 而無法計算二項機率,則可以用常態近似法。
檢定前的決策工具 可以利用以下計算各類參數及輔助圖形的樣板: 1. 樣本數樣板 2. 針對各種樣本數,β對α作圖 3. 檢定力曲線 4. 操作特徵曲線
檢定前的決策工具 手動計算所需的樣本數,其方程式 μ0 = H0 的假設值 μ1 = 型Ⅱ錯誤欲監視的μ值 z0 = zα 或 zα/2,用單尾或雙尾檢定決定之 z1 = zβ ,其中β是μ=μ1時型Ⅱ錯誤機率的界限
檢定前的決策工具
檢定前的決策工具
檢定前的決策工具 手動計算所需的樣本數 如果無法取得樣板,為了檢定母體比例可以用下列方程式計算所需樣本數 p0 = 在 H0,p 的假設值 p1 = 試圖監視之型Ⅱ錯誤下的 p 值 z0 = zα 或 zα/2,就看檢定是單尾的或雙尾的 z1 = zβ,其中β是 p = p1 時型Ⅱ錯誤機率的界限
檢定前的決策工具
檢定前的決策工具
回溯測試 (Backtesting) 檢視金融機構原先使用的風險值模式的可靠度 假設某一銀行在總天數為T,5%左尾的信賴水準 (p=1-c) 下來計算風險值。 假定其虛無假設 (Null Hypothesis) 為: p=0.01,當T=250,N=4.5 (此時虛無假設可寫成:pT=2.5,)則發生Type I錯誤的機率為
Basle 規範 監管機構應重視避免犯下type I錯誤 (95%信賴水準) 的判斷,因此Basle 比較注重金融機構是否有低估風險值的現象,並不在意風險高估。 假定在正常情況下,VaR模型的失誤率為1%,也就是說根據模型所算出的VaR,100次中有1次會失誤 (Exceptions) 的機率分配隸屬二項分配,其失誤次數的機率值以及累加機率值如下表:
如果VaR模型正確,過去250天發生穿越次數的機率如下表。在250個樣本的檢定下,其中有7次發生或7次以上穿越情況時,其p值為0 累加機率 1 2 3 4 5 6 7 8 9 10+ 8.1% 20.5% 25.7% 21.5% 13.4% 6.7% 2.7% 1.0% 0.3% 0.1% 0.01% 28.6% 54.3% 75.8% 89.2% 95.9% 98.6% 99.6% 99.9% 99.98% 99.99%
巴塞爾參數 巴塞爾協定有關資本適足之內部模型法中規定,以10個營業日為一期,99%信賴水準,來計算VaR,並且將VaR乘以3倍的安全系數,以規範最低資本額要求。 為什麼要乘以3?
Stahl (1997) 以Chebyshev’s 不等式來解釋安全係數k=3的理由 在99%信賴水準的情況下