第四章 樣本大小.

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
第四週課程 1 (10/10~10/16) 如何建立資料. 原始資料範例 a1~a5 表示選擇題,輸入原始答案,如 A 、B、C、D b1~b5 表示填充題, c1~c5 表示計算題,輸入得分.
單元九:單因子變異數分析.
第十一章 假設檢定.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
數位邏輯設計與實習 Ch02基本邏輯閘與布林代數.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
Excel –格式設定 資訊教育.
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
第 8 章 一組樣本 單變項推論方法.
17 類別資料的分析  學習目的.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
估計.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
Project 2 JMVC code tracing
Sampling Theory and Some Important Sampling Distributions
第 7 章 抽樣與抽樣分配.
計數值抽樣檢驗計劃 (MIL-STD-105E)
教材 P.264 Point Estimation To estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample.
風險值 Value at Risk (VaR) 區國強.
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
統計學(上)-常態分配 開南大學 教師:陳裕達 博士.
估計(estimation) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2018/12/27.
第五章 抽樣與抽樣分配.
單一分配 Uniform distribution
第 9 章 假設檢定 Part B ( ).
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
第十二章 單因子變異數分析.
第8章 估計 點估計 區間估計與信賴區間.
劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國立台灣大學流行病學與預防醫學研究所 國家衛生研究院生物統計與生物資訊組
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
第二次電腦實習課 說明者:吳東陽 2003/10/07.
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
由開始>所有程式>Microsoft Office> 點下Microsoft Office Excel2003
信心水準與信賴區間的解讀.
第十章 估計.
第 7 章 推論方法.
估計與假設檢定.
輸入&輸出 函數 P20~P21.
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
第七章 假設檢定.
大綱:加減法的化簡 乘除法的化簡 去括號法則 蘇奕君 台灣數位學習科技股份有限公司
挑戰C++程式語言 ──第8章 進一步談字元與字串
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
第十章 證券投資組合.
Some Important Probability Distributions
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
育達商業大學 苗進修部 休閒事業管理系 一年A班 學號: 姓名:陳 友.
流程控制:Switch-Case 94學年度第一學期‧資訊教育 東海大學物理系.
Parameter Estimation and Statistical Inference
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
第八章 銷售預測(2).
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第七章 資料轉換和 個案選擇 7.1 前言 7.2 〝Recode〞功能 7.3 〝Compute〞功能 7.4 〝Count〞功能
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
適用於多選一 可減少if 與 else配對混淆的錯誤.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

第四章 樣本大小

樣本大小之選擇 樣本不要過大, 過大浪費成本;但也不要過小, 過小 則會有太大的抽樣誤差。如何決定適當的樣本大小? 在機率抽樣的情況下, 有關樣本大小的決定及樣本統 計顯著性的判斷, 可藉由機率法則的運用。(也就是 說, 有公式可供計算啦!) 但在非機率抽樣的情況下, 除了依靠抽樣人員的主觀 判斷或假設外, 實無客觀之科學方法可資應用。

估計平均數時的樣本大小 母體變異數已知 於母體變異數(σ2)已知之情況下, 樣本數(n)之 求算公式為: α為顯著水準或風險水準, (1-α)即信賴係數或信賴水準;顯著水準表示檢定者主觀認定統計量出現「極端數值」的機率。信賴係數愈高愈好,表示估計精準。 e為可容忍誤差 σ為母體標準差:是用來衡量觀測值與平均值間的離散程度。 先別忙著計算樣本數, 由於本書是介紹Excel之書籍, 故得對所使用到的各相關函數先介紹一下。

基本定義 標準差 變異數 標準隨機變數 平均值 m

常態分配之Z值 一般統計學之常態數值(Z), 係利用查常態分配表 (附錄二)來得知。如:Z0.025為1.96、Z0.05為1.645。 但於Excel下, 則可利用NORMSINV()標準常態分配 反函數來查得;而若知道Z值, 也可以NORMSDIST() 函數來求得其機率。

標準常態分配NORMSDIST() NORMSDIST(z):由z值求機率

有了此函數, 即可省去查常態分配表某z值之機率的麻煩。 如:(詳範例光碟Ch04.xlsx『NORMSDIST』工作表)

常態分配(normal distribution)是次數分配呈中間集中, 而逐漸向左右兩端勻稱分散的鐘形曲線分佈。根據中央極 限定理, 不論原母體的分配為何?只要樣本數夠大 (n>=30), 樣本平均數 的分配, 會趨近於常態分配。

標準常態分配反函數NORMSINV() NORMSINV(累計機率) :由機率求z值 NORMSINV(probability) 其作用為於標準常態分配(μ = 0, σ = 1), 求某累計 機率所對應之Z值。有了此函數, 即可省去查常態分 配表之Z值的麻煩。如:(詳範例光碟Ch04.xlsx 『NORMSINV』工作表) =NORMSINV(0.025) 為-1.96 =NORMSINV(0.05) 為-1.645 =NORMSINV(0.5) 為0 =NORMSINV(0.95) 為1.645 =NORMSINV(0.975) 為1.96

標準常態分配表 一般統計學之教科書, 均會附有標準常態分配表(如: 附錄二), 以利查常態數值(Z)。由於, 常態分配是 對稱的分配, 故一般僅附上正值之部分, 表內之累計 機率, 是由Z值為0時開始累計。如:Z值1.96, 查得 1.96之0.475, 表示由標準常態分配中央(Z=0)開始, 累計到Z=1.96的機率。即, 下圖之陰影部份:

如要查負值之部份, 仍以正值查表。然後, 以0. 5減去 表內之累計機率即可。如:Z值-1. 96, 查得1. 96之 0. 475, 以0 如要查負值之部份, 仍以正值查表。然後, 以0.5減去 表內之累計機率即可。如:Z值-1.96, 查得1.96之 0.475, 以0.5-0.475=0.025, 即是自左尾開始累計到Z 值為-1.96的機率。 相反地, 若要計算由Z值為-1.96開始累計到右尾的機 率, 則將查得之值(0.475)加上0.5, 即0.975。通常, α=0.05時, 如要查Zα/2值, 是找尋右尾機率為0.025時 之Z值, 即找出由左尾累積得0.975之Z值1.96。若用 Excel之NORMSINV()函數來求算, 其公式應為: (詳範例光碟Ch04.xlsx『依α査Z值』工作表) =NORMSINV(1-0.05/2)

於Excel下, 利用NORMSDIST()函數即可輕易建立標準常 態分配表。其建立步驟為:(詳範例光碟Ch04 於Excel下, 利用NORMSDIST()函數即可輕易建立標準常 態分配表。其建立步驟為:(詳範例光碟Ch04.xlsx『常 態分配表』工作表) 於A2輸入Z字串, A3輸入0.0(僅顯示0), A4輸入0.1 選取A3:A4, 切換到『常用』索引標籤,按『數值』群組之 『增加小數位』鈕, 使兩數均可擁有一位小數 拖曳A3:A4右下角之複製控點, 拉到A33位置, 複製出0.0、 0.1、0.2、…、2.9、3.0等數值

於B1輸入『Z值的小數第二位』字串 於B2輸入0.00(僅顯示0), C2輸入0.01 選取B2:C2, 按『數值』群組之 『增加小數位』鈕, 使 兩數均可擁有2位小數 拖曳B2:C2右下角之複製控點, 拉到K2位置, 複製出0.00、 0.01、0.02、…、0.08、0.09等數值

於B2:K2尚呈選取之狀態, 切換到『常用』索引標籤,按 『儲存格』群組 『格式』鈕之下拉鈕,續選「自 動調整欄寬(I)」, 將各欄調整成最適欄寬 選取B1:K1, 按『對齊方式』群組 『跨欄置中』鈕, 讓 『Z值的小數第二位』字串, 於這幾欄內跨欄置中

於B3輸入=NORMSDIST($A3+B$2)-0.5 拖曳其右下角之複製控點, 往右複製到K3

於B3:K3尚呈選取之狀態, 按兩次按『數值』群組之『增 加小數位』鈕, 使各數均可有4位小數 於B3:K3尚呈選取之狀態, 按『儲存格』群組『格式』鈕 之下拉鈕, 續選「自動調整欄寬(I)」, 調整成最適欄寬 雙按K3右下角之複製控點, 將B3:K3往下複製到K33, 即 完成整個建表工作

母體變異數已知時的樣本大小 學過所需之幾個函數後, 現在, 可以 來計算於母體變異數(σ2)已知之情況下的樣本數 (n)。式中: α為顯著水準或風險水準, (1-α)即信賴係數或信賴水準 e為可容忍誤差 σ為母體標準差

假定, 母體變異數σ2=6. 25(σ=2. 5), 於風險顯著水準 α=0. 05(Zα/2=1 假定, 母體變異數σ2=6.25(σ=2.5), 於風險顯著水準 α=0.05(Zα/2=1.96)的情況下, 希望對母體均數μ的估計誤 差e不超過0.3, 其樣本數應為多大? 將σ=2.5與Zα/2=1.96代入公式 至少應取得267個樣本, 才能有95%的保證其誤差不超過 0.3。 以Excel來安排相關之數字與公式, 將為:(詳範例光碟 Ch04.xlsx『估計均數樣本數σ已知』工作表) B欄各儲存格之公式分別為: 母體標準差σ =SQRT(B1) Zα/2 =NORMSINV(1-B3/2) 樣本數n =((B4*B2)/B5)^2

假定, 電力公司根據過去之調查經驗, 知道用戶用電度數的 母體變異數為48000(σ2=48000)、於顯著水準α=0.05 (Zα/2=1.96)的情況下, 希望對母體平均用電度數μ的估計 誤差不超過5度, 其樣本數應為多大? 將相關之數字輸入Excel即可算出, 至少應取得7376個樣本, 才能有95%的保證其估計誤差不超過5度:(詳範例光碟 Ch04.xlsx『估計均數樣本數σ已知1』工作表)

馬上練習 以範例光碟Ch04.xlsx『大學生零用金樣本數』工作 表進行計算。假定, 大學生之平均每月零用錢為1200 元, 其變異數為368,560。至少應取得多少樣本?才 能有95%的信賴水準, 保證其估計誤差不超過100元。

習題三 假定大學畢業生之平均每月收入為26500元, 其變異 數為4202500。至少應取得多少樣本?才能有 9X%(X為學號最後一位數字)的信賴水準, 保證其估 計誤差不超過1000元

平方根SQRT()函數 SQRT(數值) SQRT(number) 本函數是用來求某數值的平方根, 若數值為負值, 本 函數將回應#NUM!之錯誤。如:(詳範例光碟 Ch04.xlsx『平方根』工作表)

事實上, 有無此函數並不很重要。利用 ^ 運算符號也可達 成開方之動作。如:=64^(1/2)之結果即=SQRT(64);但 若要求開三方, 那SQRT()可就無能為力了。但仍可利用 ^ 運算符號來解決(乘冪為1/3即等於開三方):

母體變異數未知的樣本大小 事實上, 實務上很多數情況是無法得知母體變異數 (σ2)。若是母體變異數未知, 則可以過去調查之樣 本變異數(S2)來替代。若過去也無類似之調查, 可 先做一小規模試訪, 以利計算樣本變異數。然後, 再 來計算樣本數: 式中: α為顯著水準或風險水準, (1-α)即信賴係數或信賴水準 e為可容忍誤差 S為樣本標準差

於Excel中, 樣本變異數可以VAR()函數來求得, 其語法為: VAR(number1,[number2],...) 數值1,[數值2],...為要計算變異數之儲存格或範圍引數, 它 是對應於某母體抽樣選出的1到255個數字引數樣本, 方括 號包圍之部份可省略。 樣本變異數(S2)的計算公式為: 其值恰為樣本標準差(S)之平方, 也是用來衡量觀測值與 平均值間的離散程度。

由於, 母體變異數未知。故舉行一次試訪, 以範例光碟Ch04 由於, 母體變異數未知。故舉行一次試訪, 以範例光碟Ch04.xlsx 『估計均數樣本數σ未知』工作表, 取得120位大學生之手機平均 月費。計算出其樣本變異數(S2)為109,593、於顯著水準 α=0.05(Zα/2=1.96)的情況下, 希望對母體手機平均月費μ的估 計誤差不超過30元, 其樣本數應為多大? 將相關之數字輸入Excel, 即可算出, 至少應取得468個樣本, 才 能有95%的保證其估計誤差不超過30元:

馬上練習 由於, 母體變異數未知。故舉行了一次試訪, 取得40位大 學生之信用卡每月平均簽帳金額。(詳範例Ch04.xlsx 『信用卡問卷樣本數』工作表)於風險顯著水準α=0.05 (Zα/2=1.96)的情況下, 希望對母體信用卡每月平均簽帳 金額μ的估計誤差不超過50元, 其樣本數應為多大?

估計比率時的樣本大小 若研究目的是在估計比率(p, proportion), 其樣本 數(n)之求算公式為: p為母體的真正比率 α為風險顯著水準, (1-α)即信賴係數 e為可容忍誤差 σp為母體標準差, 其運算公式為:

將其代入上式, 即可獲致新的樣本數(n)公式: 不過, 通常我們是無法得知母體之真正比率p, 要計算樣本 數時, 則以過去之調查結果替代。假定, 上個月支持執政黨 之比率為38%(p)。這個月, 於95%的信賴水準下 (α=0.05), 希望調查結果之支持率的允許誤差(e)為 3%, 應取樣多少? 將相關值代入公式: 至少應取得1006個樣本, 才有95%的信心, 保證其調查結果 的支持率之誤差不超過±3%。

以Excel來安排相關之數字與公式, 將為:(詳範例光碟 Ch04.xlsx『以母體比率求樣本數』工作表)

保守估計母體比率 於將前面之抽樣中, 若將不同之p值分別代入, 其樣本 數勢必不同。茲將各種結果彙集成下表來比較:(詳 範例光碟Ch04.xlsx『以母體比率求樣本數』工作表)

可發現, 其樣本數的極大值1067係發生於母體比率為0. 5時。 母體比率<0 可發現, 其樣本數的極大值1067係發生於母體比率為0.5時。 母體比率<0.5時, 隨母體比率逐漸增加, 樣本數也逐步增加。 母體比率>0.5時, 隨母體比率逐漸增加, 樣本數則逐步減少。 故而, 若我們無法得知母體真正比率p, 要計算樣本數時, 可 以採取最保守的估計, 將母體比率設定為0.5。這樣, 由於其 樣本數最大, 所獲得之結果也將是各種情況下最正確的。

馬上練習 以範例Ch04.xlsx『以保守估計求樣本數』工作表進 行計算, 保守估計執政黨的支持度為50%。要以90% 之信賴水準(風險顯著水準α=0.1), 希望調查結果 之支持率的誤差為±3%, 應取樣多少?

重點整理 NORMSDIST(z):由z值求機率 NORMSINV(累計機率) :由機率求z值 母體變異數已知時樣本的大小 母體變異數未知時樣本的大小 估計比率時樣本的大小

第四章 結束 謝謝!