3 統計 3-1 統計抽樣
統計的意義 統計工作包括蒐集資料、整理資料分析資料及解釋 意義,也就是讓一堆數字變的有意義。 統計學依理論基礎、統計技術的不同,可分為: 1. 敘述統計 2. 推理統計 統計資料量必須夠多,且必須是正確資料。
3-1 統計抽樣 常用的統計名詞 母群體:研究對象的全體稱為母群體。 樣本 (sample) :母群體中選取代表性的子集,稱此子 集為樣本。 抽樣:抽出樣本的過程,稱為抽樣。
例題 工廠生產 個燈泡,為了瞭解燈泡品質,隨機取 出 100 個檢測。母體、樣本? 母體: 燈泡 抽樣 樣本: 100 燈泡
3-1 統計抽樣 常用的抽樣方法 簡單隨機抽樣 系統抽樣 分層隨機抽樣 部落抽樣
簡單隨機抽樣 從母群體中,隨機抽出樣本,抽樣時不摻入人為因素,而 且母群體中每一個體被抽中的機會均相等。 常用方法: 電腦輔助抽樣 籤筒抽籤 亂數表
例題 四十嵐飲料店品項編號為 1 號到 48 號,想利用簡單隨機抽樣法 抽出 5 種飲料監測大腸桿菌數,試利用下列亂數表由第五行第 一列(取前 2 碼)開始,選出 5 個編號。 五種飲品編號依序為: 24 、 31 、 10 、 23 、 18
簡單隨機抽樣 優點:樣本公平且方便 缺點:樣本資料易偏於某一方,造成資料 代表性不足。
系統抽樣 只做第一次隨機抽樣後,就採取依固定間隔數抽出一樣本。 例:想瞭解光復中學高二 900 位學生的法律常識,以系統 抽樣法,抽出 60 為同學參加法律常識測驗. 間隔數: 900÷60=15 由 1 ~ 15 號碼中抽出第一個種子號碼,例如:種子號碼是 7 依序所有樣本為: 7 、 22 、 37 、 … 、 847 、 862 、 877 、 892.
例題 自然水公司研究某社區 120 個住戶的用水情況,將 120 個 住戶予以編號; 1 到 120 號。今欲以系統抽樣選取 8 個住戶, 假如已知編號 23 號的住戶被抽到,請寫出被抽到的 8 個住 戶的編號。 120÷8=15 ( 每隔 15 號抽選一個號碼 ) 已知編號 23 號住戶被抽中 抽重的 8 戶: 8 、 23 、 38 、 53 、 68 、 83 、 98 、 113
系統抽樣法 優點:較簡單隨機抽樣法方便。 限制: 當母體為循環性時則不適用。 母群體太大時不適用。
分層隨機抽樣 將母群體依某一標準分成若干層,再依各層在母體所 佔的比例分配樣本,在從每一層中依簡單隨機抽樣法 取樣。 注意 不同層間的差異越大越好,同一層內的差異越小越好。 依每層的大小比例來抽取樣本的個數。
例題 想瞭解光復中學高二 900 位學生的法律常識,抽樣方式以 分層隨機抽樣法,抽樣 60 位同學參加測驗,認為法律常識 和公民成績有關,我們可將學生公民成績分層: 80 分以上 100 人 70 ~ 79 分 300 人 70 分以下 500 人
分層隨機抽樣 限制:如何找到某種特性作為分層的依據
聚落抽樣法 將母群體依某種標準分割成差異儘量小的若干組,每 組稱之為一個部落,每個部落可視為母群體的一個縮 影,所以聚落之間差異要小。
例題 想瞭解光復中學高二 900 位學生的法律常識,抽樣方式以 聚落抽樣法,假設高二各班學生法律常識差別不是很大, 為了節省時間,可以隨機選取 2 班約 90 位學生參加法律常 識測驗。
聚落抽樣法 優點:節省時間、金錢、人力。 缺點: 抽到的部落和母體差異較大時,則會造成很大的抽樣 誤差。 比簡單隨機抽樣不一般化。
分層隨機抽樣與部落抽樣的差 異 隨機抽取若干部落,再對這些部 落作全面性的調查 ( 普查 ) 或抽查 按各層的大小,依比例在 各層中選出簡單隨機抽樣 部落可看做母群體的縮影 每個子母群體 ( 部落 ) 互相類似 子母群體 ( 部落 ) 內部有參差不同的 差異,能反應母群體內部之差異。 同一層的子母群體有同一 標準 相異處 將母群體分成若干不重疊的子母群體相同處 部落抽樣分層抽樣抽樣
動動腦 某太陽能電池廠共有 A 、 B 、 C 三間廠房, 想要調查生產電池的耐用時間,已知每個 廠房各階層員工均有,且三棟廠房彼此類 似,試問適合哪一種方式抽樣?
第三章 統計 3-2 資料整理與圖表編製
某 LED 燈泡工廠 60 為員工每日的生產力分別為: 43, 58, 62, 65, 67, 73, 50, 58, 62, 66, 68, 73, 51, 58, 63, 66, 68, 73, 52, 59, 63, 66, 69, 74, 52, 60, 63, 66, 69, 75, 54, 61, 64, 66, 70, 76, 56, 61, 64, 67, 71, 77, 56, 62, 64, 67, 71, 78, 57, 62, 64, 67, 72, 86.( 單位:個 )
3-2 資料整理與圖表編製 次數分配表 直方圖與折線圖 累積次數分配表與累積次數分配圖
3-2.1 製作次數分配表 步驟一:資料排序 將 60 位員工的生產力由低而高排列: 43, 50, 51, 52, 54, 55, 56, 56, 57, 58, 58, 58, 59, 60, 61, 61, 61, 62, 62, 62, 62, 63, 63, 63, 64, 64, 64, 64, 64, 65, 66, 66, 66, 66, 66, 66, 67, 67, 67, 67, 68, 68, 69, 69, 70, 71, 71, 72, 73, 73, 73, 74, 75, 76, 76, 77, 78, 86. 全距 =86-43=43
3-2.1 製作次數分配表 步驟二:決定組數 ( 通常是 5~25 組 ) 依資料量決定組數 LED 燈泡工廠 60 位員工的生產力: 我們可成 5 組說明
3-2.1 製作次數分配表 步驟三:決定組距 每組都取一樣的寬度 60 位員工的生產力: 43, 50, 51, 52, 54, 55, 56, 56, 57, 58, 58, 58, 59, 60, 61, 61, 61, 62, 62, 62, 62, 63, 63, 63, 64, 64, 64, 64, 64, 65, 66, 66, 66, 66, 66, 66, 67, 67, 67, 67, 68, 68, 69, 69, 70, 71, 71, 72, 73, 73, 73, 74, 75, 76, 76, 77, 78, 86. 組距 方便起見,我們取組距為 10
3-2.1 製作次數分配表 步驟四:決定組界 60 位員工的生產力: 43, 50, 51, 52, 54, …, 76, 77, 78, 86. 組別下限 上限 第一組 40 ~ 50 第二組 50 ~ 60 第三組 60 ~ 70 第四組 70 ~ 80 第五組 80 ~ 90
3-2.1 製作次數分配表 例題: 60 位員工的生產力分別為: 43, 50, 51, 52, 54, 55, 56, 56, 57, 58, 58, 58, 59, 60, 61, 61, 61, 62, 62, 62, 62, 63, 63, 63, 64, 64, 64, 64, 64, 65, 66, 66, 66, 66, 66, 66, 67, 67, 67, 67, 68, 68, 69, 69, 70, 71, 71, 72, 73, 73, 73, 74, 75, 76, 76, 77, 78, 86. 次數分配表: 組別組界次數 第一組 40 ~ 50 分 1個1個 第二組 50 ~ 60 分 12 個 第三組 60 ~ 70 分 33 個 第四組 70 ~ 80 分 13 個 第五組 80 ~ 90 分 1個1個
3-2.2 圖表編制 次數分配直方圖 次數分配曲線圖
3-2.2 圖表編制 例題:下表是 88 C 咖啡店全台 50 家連鎖店平均月 營業額 ( 單位 : 萬 ) 的次數分配表,試製作: (1) 次數分配直方圖 (2) 次數分配曲線圖 營業額 120~130 (萬) 130~140 (萬) 140~150 (萬) 150~160 (萬) 160~170 (萬) 170~180 (萬) 180~190 (萬) 個數
3-2.2 圖表編制 營業額 ( 萬 ) 個數 120~ ~ ~ ~ ~ ~ ~ (1) 次數分配直方圖:
營業額 ( 萬 ) 個數 120~ ~ ~ ~ ~ ~ ~190 1 圖表編制 (2) 次數分配曲線圖:
3-2.3 累積次數分配表與累積次數分配圖 例題:下表是 88 C 咖啡店全台 50 家連鎖店平均月營業額 ( 單位 : 萬 ) 的次數分配表,試製作: (1) 以下累積次數分配表與累積次數分配圖 (2) 以上累積次數分配表與累積次數分配圖 營業額 120~130 (萬) 130~140 (萬) 140~150 (萬) 150~160 (萬) 160~170 (萬) 170~180 (萬) 180~190 (萬) 個數
( 1 )以下累積次數分配曲線圖 營業額 ( 萬 ) 個數 以下累積次 數 ( 個數 ) 120~ ~ ~ ~ ~ ~ ~ = =19
( 1 )以上累積次數分配曲線圖 營業額 ( 萬 ) 個數 以下累積次 數 ( 個數 ) 120~ ~ ~ ~ ~ ~ ~ = =19
動動腦 某太陽能電池廠共有 50 台機台,下列資料是 50 台 機台每日的生產量,試分析這筆資料
第三章 統計 3-3 算數平均數、中位數、眾數與百分等級
3-3.1 算數平均數 資料的平衡點 以 μ 表示母體平均數: 以 x 表示樣本平均數:
3-3.1 算數平均數 例:下列是愛家房屋銷售公司近年五十筆營業額的 次數分配表 ( 單位為百萬元 ) ,試求算數平均數? 組中點
3-3.1 算數平均數
3-3.2 中位數 依數值大小排列最中間的數。 數值個數為奇數個:中位數=最中間的數。 數值個數為偶數個: 中位數=最中間二數的平均
3-3.2 中位數 例:下列是新竹縣柿農本季採收是子的成果 ( 單位是 台斤 ) ,試問中位數為何? 答:共有 12 筆資料 最中間兩個值
3-3.3 眾數 觀察值中出現最多次的數值 例:表為某超商飲料購買狀況調查整理成 如下的次數分配,試找找眾數。 眾數:即最常購買的飲料, 是 Coke Classic 。
動動腦 假設你是一位汽車銷售業務員,下列是你去年一 整年銷售量的次數分配,請問哪一種統計量 ( 算數 平均數、中位數或眾數 ) 有利於你的報告呢? 月份 銷售量
第三章 統計 3-4 標準差
觀察資料的離中趨勢或離差 全距 四分位距 變異數 標準差
3-4.1 四分位距 觀察資料 四分位距 IQR = Q 3 Q 1
3-4.1 四分位距 例:下列是新竹縣柿農本季採收是子的成 果 ( 單位是台斤 ) ,試計算全距與四分位距? 2710, 2755, 2850, 2880, 2880, 2890, 2920, 2940, 2950, 3050, 3130, 3325 四分位距 IQR = 3000 2865=135 全距 3325 2710=615
3-4.2 變異數 變異數之定義: 母體變異數: 樣本變異數:
3-4.2 變異數 例題:某太陽能電池廠其中五台機台每日的生產力分別是 46 、 54 、 42 、 46 、 32 單位,試求樣本變異數? 生產力平均生產力
3-4.3 標準差 標準差之定義: 母體標準差: 樣本標準差:
3-4.3 標準差 承上題,樣本標準差為何?
動動腦 以下是某人力銀行調查大學生起薪,試求 樣本的標準差
3-4.3 標準差
答: (1) 班平均 65 ,標準差 6
答:答: (2) 班平均 60 ,標準差 9
第三章 統計 3-5 信賴區間與信心水準的解讀
一組資料呈常態分配,已知資料的平均數 ,標準 差是 s 68% 95% 99.7%
例題 某 LED 燈泡工廠 60 為員工每日的生產力分別為 : 43, 50, 51, 52, 54, 55, 56, 56, 57, 58, 58, 58, 59, 60, 61, 61, 61, 62, 62, 62, 62, 63, 63, 63, 64, 64, 64, 64, 64, 65, 66, 66, 66, 66, 66, 66, 67, 67, 67, 67, 68, 68, 69, 69, 70, 71, 71, 72, 73, 73, 73, 74, 75, 76, 76, 77, 78, 86. 且 ,
1 3-5 信賴區間與信心水準的解讀
2 解:解: