新課程綱要研習 統計與機率篇 高雄市國教輔導團數學領域 郭逸民修正版2006/06/16
新綱統計能力指標 9-d-01 能將原始資料整理成次數分配表,並製作統計圖形,來顯示資料蘊 含的意義。
教師教學須知 統計重點為概念性陳述,不注重計算。 統計概念為離散性資料模擬連續性資料,所以計算結果不唯一。 統計利用直方圖、折線圖與盒狀圖說明資料分佈情形,所以教師必須先認知圖形變化的解讀。 教師教授統計時,可以藉助資訊軟體如EXCEL來驗證圖與數據資料,但教學時可以用圖形來說明相關數據資料即可。 學生學習重點在認知圖形代表意義、繪製圖形與表示資料集中的三個數據,至於四分位數、百分位數到全距、四分位距等數據不唯一者只需講解方法,建議不列入考題(除非保證答案不會出現爭議)。
新綱統計-資料集中趨勢三數據 平均數:代表性易被接受,永遠存在唯一一個,所有數值都使用到, 不像眾數或中位數忽略極端之數字。 中位數:不受極端值影響,恆為資料中間分界,存在且易瞭解。 眾數:易瞭解不受極端值影響,可能好幾個或沒有眾數,甚至不隨資料 變動而改。
新綱統計-資料離散程度兩數據 全距(最大-最小) 四分位距(離度) (第三個四分位數Q3-第一個四分位數Q1) 離值群(P90&P10)非國中教材
新綱統計-概念性陳述 主要增加四分位數、百分位數與盒狀圖 已知原資料- 可用下述公式求p百分位數: (1) p % × 總次數= a (2) 若a 非整數,取其整數部分再加1,以k代表之, 則由小到大之第k個資料為「p百分位數」。 (3) 若a為整數,令k=a,則由小到大之第k個 資料與第(k+1)個資料之平均值為「p 百 分位數」。 (4)Q1=25%,P=25求第一個四分位數 Q2=50%,P=50求第二個四分位數(中位數) Q2=75%,P=75求第三個四分位數
【例1】 由甲書店各類書籍之銷售量數據了解讀者之喜好, 做為行銷之依據。 a. 所有到甲書店買書的讀者所買之書籍是「群體」 ,書籍的種類是「變數」。 b. 書 籍 種 類 1. 文 藝 小 說 2. 各國文學 3. 推 理 科幻 4. 自然文學 5. 武 俠 6. 翻 譯 7. 繪 本 學 8. 影 視 小說 9. 古 典 10. 民 間 11. 歷 史 12. 旅 行 13. 奇 幻 銷 售 數 量 (本) 158 56 211 75 301 142 351 311 125 104 93 187 205
【例2】 由全班數學成績數據了解學生之學習狀況。 a.全班同學是「群體」,數學成績是「變數」。 b. 數學成績表 座號 1 2 3 4 5 6 7 8 成績 65 35 75 45 85 9 10 11 12 13 14 15 16 55 17 18 19 20 21 22 23 24 25 26 27 28 29 30
名詞解釋 一.次數: 群體中變數等於某一值之計數。 【例1續】讀者所買之書籍(群體)中,書籍種類(變數)為 推理科幻類者有 211 本,則 211 即為購買推 理科幻類書籍之「次數」。 【例2續】全班同學(群體)中,數學成績(變數)考 65 分 的有 5 人,則 5 即為同學數學考65分之「次 數」。
二、相對次數:群體中變數等於某一值之次數除以群體之總個數。 【例1續】該月銷售總數為 2319,則 211/2319 即為 購買推理科幻類書籍之「相對次數」。 【例2續】全班共有 30 人,故 5/30 即為班上數學考 65 分之「相對次數」。
變數類型之影響 一、變數為類別資料(如:書籍種類)時,其(相對)次數分配圖被稱為「長條圖」,又因為類別資料無一定之順序,故所做之圖不唯一。 【例1續】 書籍種類銷售數量之次數分配圖 當各資料具獨立性,製作成長條圖。
二、變數為(有序)數值資料時,其(相對)次數分配圖被稱為「直方圖」。 【例2續】 數學成績之次數及相對次數表 分數 5 15 25 35 45 55 65 75 85 次數 1 0 4 5 3 9 相對次數 1/30 0/30 0/30 4/30 5/30 3/30 9/30 當各資料具可以有序分類或彼此具比較性時,製作成直方圖。
【例2續】整數直方圖:成績(相對)次數分配圖 原始資料次數分配圖易與長條圖混淆,改以下圖方式較佳,但與長方形的面積無關。 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0 10 20 30 40 50 60 70 80 90 100 分數 相對次數 注意:相對次數分配圖符號性表達方式與面積無關。
教學項目壹(9-d-01) 製作直方圖及其折線圖以觀察有序數值資料之三項(中心、型態、變異) 群體特徵: (1)中心位置(center) 0.3500 0.3000 0.2500 0.2000 機率 0.1500 0.1000 0.0500 0.0000 1 2 3 4 5 6 單峰 雙峰
(2)型態(對稱或偏斜及離群值) 對稱 左偏 右偏 0.0000 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 1 2 3 4 5 6 機率 對稱 0.0000 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 1 2 3 4 5 6 機率 0.0000 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 1 2 3 4 5 6 機率 左偏 右偏
(3)變異狀況(variability) 相對集中 相對分散 0.0000 0.0500 0.1000 0.1500 0.2000 0.2500 0.3000 0.3500 0.4000 1 2 3 4 5 6 7 8 機率 相對集中 相對分散
三年一班數學成績之整數直方圖及 Dot Plot 【例3】 三年一班數學成績表 座號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 成績 64 35 78 36 43 44 82 83 48 52 55 58 65 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 68 69 70 74 80 45 47 33 84 85 89 三年一班數學成績之整數直方圖及 Dot Plot 整數直方圖顯現原始資料實際情形,但不易觀察資料群體特徵。
三年一班各組成績次數表及相對次數表 【例3續】 分組(1):始點為0;組距為20 三年一班各組成績次數分配圖 三年一班各組成績相對次數分配圖 三年一班各組成績次數分配圖 三年一班各組成績相對次數分配圖 相對次數 成績 1.利用分組呈現資料群體特徵,是一種近似方法。 2.本例題以20分為組距,且每組組距為包含上下限的封閉區間。
三年一班各組成績次數分配圖 三年一班各組成績相對次數分配圖 【例3續】 分組(2) :始點為5;組距為17 三年一班不同分組法的各組成績次數表相對次數表 三年一班各組成績次數分配圖 三年一班各組成績相對次數分配圖 2 4 6 8 10 12 5 21 38 55 72 100 成績 次數 0.4 0.35 0.3 0.25 0.2 相對次數 0.15 0.1 0.05 89 5 21 38 55 72 89 100 成績
三年一班各組成績次數分配圖 三年一班各組成績相對次數分配圖 【例3續】 分組(3):始點為0;組距為10 三年一班不同分組法的各組成績次數表相對次數表 分組分數 0-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90 次數 1 4 5 3 9 相對次數 1/30 0/30 4/30 5/30 3/30 9/30 三年一班各組成績次數分配圖 三年一班各組成績相對次數分配圖 1 2 3 4 5 6 7 8 9 10 0 10 20 30 40 50 60 70 80 90 100 成績 次數 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0 10 20 30 40 50 60 70 80 90 100 成績 相對次數
【例3續】 三種三年一班成績相對次數分配圖 未分組 分組(1) 分組(2) 分組(3) 成績 0.00 0.05 0.10 0.15 【例3續】 三種三年一班成績相對次數分配圖 未分組 分組(1) 相對次數 成績 分組(2) 分組(3) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0 10 20 30 40 50 60 70 80 90 100 成績 相對次數 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 5 21 38 55 72 100 成績 相對次數 89
經分組資料較易判讀出資料趨勢與群體特徵,不同組距效果有別 。 【例3續】 三年一班各組成績次數分配圖及折線圖 (分組1) (分組2) 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 5 21 38 55 72 100 成績 相對次數 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 20 40 60 80 成績 相對次數 100 89 (分組3) (未分組) 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0 10 20 30 40 50 60 70 80 90 100 成績 相對次數 經分組資料較易判讀出資料趨勢與群體特徵,不同組距效果有別 。
教學項目貳(9-d-02;9-d-03) 將資料排序以了解個體在群體中相對地位之情形。 【例3續】 序號 1 2 3 4 5 6 7 8 9 10 成績 33 35 35 36 43 44 45 47 48 11 12 13 14 15 16 17 18 19 20 52 55 58 64 64 65 68 69 70 74 21 22 23 24 25 26 27 28 29 30 78 80 80 80 82 83 84 84 85 89 資料排序目的:1.求百分位數2.製作累計相對次數折線圖(由圖找出百分位數)。
【說明】原始樣本資料之百分位數有明確之定義 [定義1 Galton;1885 ] 百分率(Percentage) P 之「樣本」 百分位數(Percentile) t 符合: 1.至少有 P% 之觀察值(樣本)小於 或等於t 2.至少有 (100-P)% 之觀察值(樣本) 大於或等於t 參考資料:Kendall's Advanced Theory of Statistics,P.50
建議使用的計算百分位數公式 【例3續】 三年一班成績之百分位數計算 (1) 90% × 30=27 第27個=84 第28個=84 (1) 90% × 30=27 第27個=84 第28個=84 90百分位數=(84+84)/2=84 (2) 75% × 30=22.5 第23個=80 75百分位數=80 (3) 50% × 30=15 第15個=64 第16個=65 50百分位數=(64+65)/2=64.5 (4) 25% × 30=7.5 第8個=45 25百分位數=45 (5) 10% ×30=3 第3個=35 第4個=35 10百分位數=(35+35)/2=35
圖解使用的求百分位數方式 【例3續】 三年一班成績累計百分率圖 90% 75% 25% 10% 35 45 64 65 84
【例4】原始資料為21,23,23,26,28,33之累積相對次數分配圖 (資料個數少,沒有或不需分組時,直接以原始資料來做統計相關判讀) 次數表 資料 21 23 26 28 33 次數 1 2 1 1 1 相對次數 1/6 2/6 1/6 1/6 1/6 累加相對次數 1/6 3/6 4/6 5/6 6/6 累積相對次數分配圖 1/6 3/6 4/6 5/6 1 21 23 28 33 GSP 26
【例4續】 75百分位數 = 28 5/6 > 0.83 ≧ 0.75 2/6 > 0.33 ≧0.25 1/6 3/6 4/6 5/6 1 21 23 28 33 75% 50% 26 75百分位數 = 28 5/6 > 0.83 ≧ 0.75 2/6 > 0.33 ≧0.25 50百分位數 = 23 3/6 = 0.5 ≧ 0.5 5/6 > 0.83 ≧0.5 50百分位數 = 24.5 3/6 = 0.5 ≧ 0.5 3/6 = 0.5 ≧0.5 50百分位數 = 26 4/6 > 0.66 ≧ 0.5 3/6 = 0.5 ≧0.5
教學項目參(9-d-04 ~ 9-d-08) 用二個量測數據去了解整體 方法一: 用特徵值 如:中心、離度、離群值 方法二: 用簡易圖形綜合上述特徵值 如: 「盒狀圖」
【方法一說明】 對一個(相對)次數分配而言,最重要的特徵值有三項, (1) 代表值:中心 (2) 分散程度:離度 對一個(相對)次數分配而言,最重要的特徵值有三項, (1) 代表值:中心 (2) 分散程度:離度 (3) 異常狀況:離群值(非國中教材) 若以百分位數表示法視之,則可以 (1)中位數(50百分位數)表示「中心」。 (2)全距(即:最大值減最小值)及四分位距(即:75百分位數 減25百分位數)表示「離度」。 (3)10百分位及90百分位表示「離群值」。(非國中教材) 若僅看中心與離度,則百分位數可進一步簡化為四分位數。
四分位數的求法: 25百分位數、 50百分位數及75百分位數又分別被稱為第1四 分位數(Q1),第2四分位數(M) 及第3四分位數(Q3),但二者 並不完全相同。 (a) 慣用求Q1、 M、 Q3 之方法: (a.1) 若總數 N 為奇數,則取排序後之第 個為中位數(M) (a.2) 若總數 N 為偶數,則取排序後之第 及第 個數 之平均值為中位數(M) (a.3) 不包含中位數,小於中位數之資料的中位數為第1四分 位數(Q1) (a.4) 不包含中位數,大於中位數之資料的中位數為第3四分 位數(Q3)
Q1以中位數(50%)資料前半再求其中位數,因估算兩次與直接25%求法不同。 【例5】 N=5 數據 21 23 28 30 31 求值 Q1=22 M=28 Q3=30.5 (1/5 = 0.2 < 0.25) N=6 數據 19 21 23 28 30 31 求值 Q1=21 M=25.5 Q3=30 N=7 數據 19 21 23 28 30 31 32 求值 Q1=21 M=28 Q3=31 N=8 數據 18 19 21 23 28 30 31 32 Q1=20 M=25.5 Q3=30.5
(b)用樣本百分位求25、50、75百分位數( 法) 【例5續】 前述方式圖形化,方便判讀原始資料個數與求四分位數法造成的差異。
(c)二者比較 EXCEL驗證 N 求法 Q1 M Q3 5(4k+1) 四分 22 28 30.5 百分 23 30 6(4k+2) 21 25.5 7(4k+3) 31 8(4k+0) 20 EXCEL驗證
(c)二者比較(續) (N=5) 21、23、28、30、31 Q1 (22) 1/5 = 0.2 < 0.25 4/5 = 0.8 > 0.75 25百分位數(23) 2/5 = 0.4 > 0.25 Q3 (30.5) 4/5 = 0.8 > 0.75 1/5 = 0.2 < 0.25 75百分位數(30) 2/5 = 0.4 > 0.25
建議使用的計算四分位數公式 【例3續】 四分位數之計算 (a.1) N = 30為偶數,N/2 = 15 【例3續】 四分位數之計算 (a.1) N = 30為偶數,N/2 = 15 第 15 個數 = 64,第 16 個數 = 65 M = (64+65)/2 = 64.5 (a.2) 不包含M,小於M之資料有 15 個,為奇數 15/2 = 7.5 , Q1 =第 8個數 = 45 (a.3) 不包含M,大於M之資料有 15個,為奇數 15+(15+1)/2 = 23 Q3 =第 23 個數 = 80
【例3續】 四分位數之計算(若去掉考 5 分者) (a.1) N = 29為奇數,(29+1)/2 = 15 M = 第 15 個數 = 65 (a.2) 不包含M,小於M之資料有 14 個,為偶數 第 7 個數 = 45 ,第 8 個數 = 47 Q1 =(45+47)/2 = 46 (a.3) 不包含M,大於M之資料有 14 個,為偶數 第(15+7)個數 = 80 ,第(15+8)個數 = 80 Q3 = (80+80)/2 = 80
當資料無極端值時,四分位距較能表現出原資料離散情形,全距反而亦造成錯誤判讀。 全距與四分位距之比較 【例3續】 中位數 : 64.5 全距 : 89-5=84 四分位距 : 80-45=35 若去掉考5分者(剩29人) 中位數 : 65 全距 : 89-33=56 四分位距 : 80-46=34 最小數 Q1 M Q3 最大值 5 45 64.5 80 89 當資料無極端值時,四分位距較能表現出原資料離散情形,全距反而亦造成錯誤判讀。 最小數 Q1 M Q3 最大值 33 46 65 80 89
【方法二說明】 五數綜合之「盒狀圖」(Box Plot) 【例3續】 盒狀圖: 五數: 最小數 第1四分位數 中位數 第3四分位數 最大數 符號: min Q1 M Q3 max 數值: 5 45 64.5 80 89
【例3續】另一種「盒狀圖」(Box Plot) (非國中教材) 五數 : 10百分位 Q1 M Q3 90百分位 數值 : 35 45 64.5 80 84 盒狀圖:
(1) 中位數是排名中間之值,故不受異常大(或小)值影響, 如:買房子的人可視地區房價之中位數為一典型房屋 售價參考值。 平均數 中位數 眔數 61.8(63.8) 64.5(65) 80(80) 【例3續】 〔註〕括號中為去掉考 5 分者 三個數不同,該用那個代表中心呢? (1) 中位數是排名中間之值,故不受異常大(或小)值影響, 如:買房子的人可視地區房價之中位數為一典型房屋 售價參考值。 (2) 平均值與總和有關,故極受異常大(或小)值影響, 如:房屋銷售員是依銷售總價抽佣金,故應以房價之 平均值計算銷售一屋之典型收入估計值。 (3) 眔數表現的是佔最大比例的數,當眔數之相對次數超 過1/2時,就極具代表性。 如:蓋房子的人要選擇為大多數人接受之房屋造價, 故應以地區房價之眔數值做為典型參考依據。
新綱統計Q&A 問1:九年一貫數學學習領域「機率與統計」國中階段的教學目標為何? 問2:統計的意義為何? 問3:如何表現「群體」之資訊? 問4:九年級學統計的層次為何? 問5:中山國中三年一班有30人,數學考試的成績只有少數相同,畫出的次數分配圖中大部分次數都是1,根本看不出訊息,要怎麼辦呢? 問6:如何分組才對? 問7:何謂折線圖?為何需要折線圖? 問8:如何知道個體在群體中之相對位置? 問9:何謂百分位數(Percentile)與百分率(Percentage)? 問10:何謂累積相對次數分配? 問11︰如何求百分位數﹖ 問12:何謂百分等級(Percentile Rank)?(非國中教材) 問13:如何求百分等級? 問14:不是平均數才是中心之量度嗎?
問1:九年一貫數學學習領域「機率與統計」國 中階段的教學目標為何? 問1:九年一貫數學學習領域「機率與統計」國 中階段的教學目標為何? 答:1、理解統計的意義, 2、理解機率的意義, 3、認識各種簡易統計方法。 ﹝註﹞國小階段之教育目標則為: 能報讀簡單統計圖形(長條圖、折線圖、 圓形圖)並理解其概念。
問2:統計的意義為何? 答:經由數據(某一變數之量度值)探索某一 「群體」之資訊。 注意:我們需要的是整個「群體」展 現之 圖像,而數據(Data)則為 個體特徵之量度值。 說明:國中教學中之群體是針對「原 始資料(樣本)」,不涉及「母 體」。
問3:如何表現「群體」之資訊? 答:群體資訊的重點在相互間之比較, 或群體展現之型態,可用「變數」 的次數分配圖,或相對次數分配圖 表現之。
問4:九年級學統計的層次為何? 答:類別資料的各種表示法在六年級以前 已討論過,九年級的統計學習是針對 (有序)數值資料,所以現在我們只針 對有關(有序)數值資料的統計方法做 討論。 年級 三 四 五 六 項目 資料 長條圖 折線圖 圓形圖 (有序資料) 工作 整理 分組 報讀 製作
問5:中山國中三年一班有30人,數學考試的成績只有少數相同,畫出的次數分配圖中大部分次數都是1,根本看不出訊息,要怎麼辦呢? 答:我們可以用分組的方式,來顯現直方圖 的近似型態,由於只是「近似」 ,故表 示法不唯一,當使用不同之分組方式時 ,結果就會不同。
問6:如何分組才對? 答:這是一個很難的問題,通常要靠經驗 及嘗試錯誤才能決定,亦無所謂之正 確答案,故不宜在國中教授。本教材 只針對已分組好的資料做製圖與解讀 之工作。
問7:何謂折線圖?為何需要折線圖? 答:折線圖是用來還原有序數值資料分佈圖 (直方圖)原有之連續形式(即:smoothing) 的圖形,由前述之分組方式可看出,例如由 21分到40分之次數都被視為是4,相對次數 均被視為是0.13,但實際上21分到40分之次 數應為連續變化,以直線連接直方圖相鄰兩 區間中點之資料值(如:10分與30分的點), 即成為折線圖。
問8:如何知道個體在群體中之相對位置? 答:用百分位數(Percentile)與百分率 (Percentage)或百分等級Percentile Rank;PR) 。基本上就是「排名次」。
問9:何謂百分位數(Percentile)與百分率 (Percentage)? 答:累積相對次數分配以百分率為縱軸之單位 時,分配圖上某一點橫軸之讀值為百分位 數,縱軸之讀值為百分率,表示有百分之 多少(百分率)的資料比該百分位數小或相同 。 注意:「百分等級(Percentile Rank;PR)」 是「百分率」整數化之結果,如何 做將說明於後。
問10:何謂累積相對次數分配? 答:「累積相對次數分配圖」又被稱為 「經驗分配圖」,作法為由零開始 由左而右橫畫直線,當橫軸遇到樣 本點時,圖形即向上跳躍其相對次 數之高度。
問11︰如何求百分位數﹖ 答︰百分位數之求法可利用「累積百分率圖」 反求之,即:由緃軸之百分率p的位置作 一水平線與圖中之階梯狀線相交,由交集 做鉛直線取得之橫軸之區間,若反求之值 為唯一解,則為其百分位數。前例中75百 分位數為28;若反求之值不唯一,則取中 點,前例中50百分位數可為〔23,26〕中之 任何值,其取法不唯一,我們取中點24.5 為50百分位數。
答﹕我們亦可用下述公式求p百分位數: (1) p % × 總次數= a (2) 若a 非整數,取其整數部分再加1,以k 代表之,則由小到大之第k個資料為「p 百分位數」。 (3) 若a為整數,令k=a,則由小到大之第k個 資料與第(k+1)個資料之平均值為「p 百 分位數」。
問12:何謂百分等級(Percentile Rank)?(非國中教材) 答:(1) 百分等級用於樣本數很大時(如:國中基測之考生人數)。 (2) 百分等級是由樣本值(如:某生之考試成績)出發,去求 該生在全體中之排名(由小(低分)到大(高分)),並以百分 率表示排名(如:1000人中排名倒數56之百分率為5.6,即 :5.6%) 。 (3) 由於等級(名次)需為整數,所以百分等級是將百分率整數 化之結果。 (4) 百分等級形同將全體分成100組,同一組內之差異被忽視 (如:1000人中排名倒數第50名到第59名的百分等級都是5)。 (5) 百分率變為整數的方法(如:四捨五入、去掉小數或無條件 進位)是依據能夠保證「成績低於或等於該樣本點的百分率 一定小於或等於(百分等級)%」。
問13:如何求百分等級? 答:(1)要注意兩個問題 a.總數不能被100整除時之處理。 b.同分者被分到不同之等級之處理。 (2)公式之一 若樣本值(某考生得分)為S,則S相對之百分等級PR算法為 參考資料:International Encyclopedia of Statistics;P.779 [註]由於同分者造成不能完全排序之問題(Partial ordering) ,故PR之算法不唯一,但因為PR原就是一種概算值,所以 問題不大。
問14:不是平均數才是中心之量度嗎? 答:各種特徵值量度之方式本來就不唯一, 如前述表示「離度」之量度有全距、四 分位距及高中才會學到的標準差;而一 般表示「中心」的量度,則有:平均值 、中位數與眔數,其中平均值是指總和 的平均,而眔數則為出現次數最高之值 。
EXCEL程式驗證統計相關資料 ~資訊融入教學方式 函數程式部分 圖表部分 COUNTIF()求次數 RANK()求名次 QUARTILE()求四分位數 PERCENTILE()求百分位數 AVERAGE()求平均數 MEDIAN()求中位數 MODE()求眾數 資料分析:求次數分配表與直方圖 直方圖 折線圖 盒狀圖(SPSS) 資訊軟體為輔助教學,僅提供教師教學應用而已。
統計之實例演練篇 已分組資料--- 未分組資料--- 21,23,23,26,28,33 座號 成績 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 成績 64 35 78 36 43 44 82 83 48 52 55 58 65 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 68 69 70 74 80 45 47 33 84 85 89 未分組資料--- 21,23,23,26,28,33
分組資料實例演練(Excel運用) ※原資料---組距20之演練 三年一班數學成績表 座號 成績 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 成績 64 35 78 36 43 44 82 83 48 52 55 58 65 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 68 69 70 74 80 45 47 33 84 85 89
COUNTIF(range範圍,criteria條件準則) Excel COUNTIF(range範圍,criteria條件準則) (範圍記得按F4變為絕對範圍) 相對次數=該次數占總次數的百分比 累積相對次數=將相對次數累加起來 次數分配表(COUNTIF函數) 分組分數 0-20 21-40 41-60 61-80 81-100 總計 次數 1 4 8 11 6 30 相對次數 0.03 0.13 0.27 0.37 0.20 1.00 累積相對次數 0.17 0.43 0.80
直方圖求次數分配與繪圖 Excel Excel中 功能表/工具(T)/增益集(I)/分析工具箱 功能表/工具(T)/資料分析(D) 輸入:成績範圍, 組界:分組分數上限 勾選累積百分率與圖表---同步完成
RANK(Number(數字,ref參照位址,order順序) RANK()排序求百分等級(PR值) Excel RANK(Number(數字,ref參照位址,order順序) ※參照位址需按F4 變成絕對位址範圍 座號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 成績 64 35 78 36 43 44 82 83 48 52 55 58 65 68 69 70 74 80 45 47 33 84 85 89 百分等級
百分等級:工具/資料分析/等級與百分比 Excel 功能表/工具(T)/資料分析(D) 排完再利用遞增排列還原次序
離散程度 Excel 全距(最大-最小) 四分位距(離度) (第三個四分位數Q3-第一個四分位數Q1) 離散值(P90&P10)非國中教材
四分位數與百分位數 Excel QUARTILE(array,quart0~4)四分位差 PERCENTILE(array,percent)百分位數 array:範圍 percent:百分比0%~100% 以QUARTILE()求四分位數 以PERCENTILE()求百分位數 最小(0%) 5 百分比 第一個Q1(25%) 47 10% 35 第二個Q2(50%) 66.5 25% 第三個Q3(75%) 80 30% 48.4 最大(100%) 89 50% 68 75% 全距=最大-最小= 84 90% 四分位距(離度) 100% Q3-Q1= 33
集中趨勢 平均數:代表性易被接受,永遠存在唯一一個,所有數值都使用到, 不像眾數或中位數忽略極端之數字。 中位數:不受極端值影響,恆為資料中間分界,存在且易瞭解。 眾數:易瞭解不受極端值影響,可能好幾個或沒有眾數,甚至不隨資料 變動而改。
已分組資料之集中 Excel 資料已分組集中趨勢 AVERAGE()算術平均 61.17 分組分數 0-20 次數 1 累積次數 相對次數 AVERAGEA()整體含缺席平均 61.17 59.19 分組分數 0-20 21-40 41-60 61-80 81-100 總計 次數 1 4 8 11 6 30 累積次數 5 13 24 相對次數 0.03 0.13 0.27 0.37 0.20 0.51 累積相對次數 0.17 0.43 0.80 1.00 組中點 10 50 70 90 組中點*次數 120 400 770 540 1840 平均 61.33 中位數M 63.64 眾數M0 89.09
已分組資料之離散 Excel 資料離散程度 以QUARTILE()求四分位數 以PERCENTILE()求百分位數 最小(0%) 5 百分比 47 10% 35 第二個Q2(50%) 66.5 25% 第三個Q3(75%) 80 30% 48.4 最大(100%) 89 50% 68 75% 全距=最大-最小= 84 90% 四分位距(離度) 100% Q3-Q1= 33
未分組資料之集中與離散 集中: 分散: Excel GSP 21,23,23,26,28,33 平均數AVERAGE() 全距 中位數 眾數MODE() 全距 四分位距 集中趨勢 離散程度QUARTILE() 平均 中位數 眾數 四分位數 全距 四分位距 25.7 24.5 23 極小 21 12 4.5 AVERAGE() MEDIAN() MODE() 1 Q1 2 Q2 3 Q3 27.5 4 極大 33
已分組的直方圖與盒狀圖
未分組的直方圖與盒狀圖
新綱機率能力指標 9-d-09 能以具體情境介紹機率的概念。 9-d-10 能進行簡單的實驗以了解抽樣的不確定性、隨機性質等初步 概念。
教學項目肆 (9-d-09) 機率之數學定義與基本計算 機率為事件發生可能性之量度值,若假設 可能發生狀況之機率 均相等(equally likely) ,事件之機率可定義為「頻度比」。 〔定義〕 (1) 稱所有可能產生之結果所成之集合為「樣本空間」。 (2) 稱欲量測發生率之結果所成之集合為「事件 」 。 (3) 假設樣本空間中每一元素發生之機率均相等(equally likely) ,則定義事件 之機率為
問:三年一班有30位同學(群體),其中20位 答: 20/30 = 2/3 【說明1】「群體」之個數比 是男生,10位是女生,若由班上「隨機」 抽出一位同學,抽中男生之機率為多少? 答: 20/30 = 2/3 (1) 抽一位同學之可能結果有30種,這30種結 果構成「樣本空間」。 (2) 「隨機」抽即:「機率相等」假設。 (3) 我們欲量測發生率的結果為男生,故20個 男生所成之集合為「事件 」。
答:3/6 = 1/2 問:擲一公平之骰子(系統),偶數點出現 【說明2】 「系統」之發生率 (1) 擲骰子可能發生之情況有6種,即: 之機率為何? 答:3/6 = 1/2 (1) 擲骰子可能發生之情況有6種,即: 1﹑2﹑3﹑4﹑5﹑6點, 故樣本空間 =﹛1,2,3,4,5,6﹜。 (2) 「公平」之骰子即「機率相等」假設。 (3) 我們欲量測發生率的是偶數點,故事 件 =﹛2,4,6﹜
問:較複雜之狀況,如何算機率? 答:用一種工具,叫「樹狀圖」, 及機率之乘法律和加法律。
哪些結果?及各種結果發生之機率為何? 擲第一枚 可能之結果 擲第二枚 可能之結果 1/2 1/2 1/2 1/2 1/2 1/2 【例6】 擲兩枚一面為白色一面為黑色之公平圓幣,問會出現 哪些結果?及各種結果發生之機率為何? 最終 可能之結果 機率 結果之另一 種表述法 1/4 二次白色 一次白色 一次黑色 1/2 二次黑色 樣本空間 相等 事件 擲第一枚 可能之結果 擲第二枚 可能之結果 1/2 1/2 1/2 1/2 1/2 1/2
教學項目伍 (9-d-10)(選擇教學) 用實驗說明抽樣的不確定性及隨機性概念 【例7】中山國中共有學生3600位,其中1200位為女生, 2400位為男生,男生佔總人數之比例為 = 2/3。 若由中山國中「隨機」抽出360位同學做為樣本, 算出這360位同學中有270位為男生,佔樣本總數 之比例為 = 3/4。我們可以透過 = 3/4,去猜 測(或了解) 值為何嗎?
母體與樣本 【例7續】 (不變的) 母體:中山國中之全部學生(3600人) 。 (變動的) 樣本:由中山國中全體學生(母體)中「隨機」 抽出360位學生。 【例8】 (不變的) 母體:中山國中三年一班之學生 (30人;20位學男生,10位女生)。 (變動的) 樣本:由中山國中三年一班學生中「隨機」抽 出 5 位同學。
Ι.抽樣之不確定性 不同的人抽的結果不同, 同一個人抽兩次結果也不同, 實際上只能抽一組樣本,其結果為何?(不確定) 樣本 1 2 3 4 5 1.張同學抽之結果 男 男 男 女 男 4/5 2.李同學抽之結果 男 男 女 女 男 3/5 3.王同學抽之結果 女 男 男 男 女 4.張同學再抽之結果 男 女 女 女 男 2/5 不同的人抽的結果不同, 同一個人抽兩次結果也不同, 實際上只能抽一組樣本,其結果為何?(不確定)
Π.抽樣之隨機性 如果能控制到母體中每個元素被抽 到之機會均相同(隨機抽樣,equally likely),則可算出可能結果之機率 分配。
Π.抽樣之隨機性(續) 重複抽樣32次之結果( ) 3/5 4/5 1 2/5 1/5
Π.抽樣之隨機性(續) 問:上列分配圖有何訊息? 樣本統計量相對次數分配圖(理論) 樣本統計量相對次數分配圖(實驗) 0.00 0.10 樣本統計量相對次數分配圖(理論) 樣本統計量相對次數分配圖(實驗) 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0/5 1/5 2/5 3/5 4/5 5/5 機率 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0/5 1/5 2/5 3/5 4/5 5/5 機率 問:上列分配圖有何訊息?
問:機率和統計有何關係? 答:日後大家會學到統計的另一項重要工 作是「用資料做推論」,即:經由抽 取少數樣本,來推論整個母體之性質 ;為什麼要推論,因為抽樣之不確定 問題。為什麼能推論,因為使用了「 隨機」抽樣之方法,所以可以靠機率 算出統計量的分配,即:靠抽樣之 隨機性。
問:學完這些,我們會至少具有哪些能力呢? 答:你可以由下列四個能力指標評估自己的能力! 1. 能報讀百分位數,並認識個體在群體中相對地位 的情形。(D-4-01) 2.能利用統計量,例如:平均數、中位數及眔數等 ,來認識資料集中的位置。(D-4-02) 3.能利用統計量,例如:全距、四分位距等,來認 識資料分散的情形。(D-4-03) 4.能在具體情境中認識機率的概念。(D-4-04) 最後,祝您學習愉快 THE END