Presentation is loading. Please wait.

Presentation is loading. Please wait.

第一章.

Similar presentations


Presentation on theme: "第一章."— Presentation transcript:

1 第一章

2 第二章 敘述統計的方法 第一章

3 本章綜覽 資料的組織與彙整 敘述性測度 電腦軟體的應用:EXCEL 相關功能簡介 常用表格: 次數分配表與相對次數分配表
常用圖表: 長條圖、直方圖、圓形圖、肩形圖 敘述性測度 位置測度: 樣本平均數、樣本中位數等 變異性測度:樣本變異數、 樣本變異係數等 其他測度:樣本百分位數、樣本四分位數 電腦軟體的應用:EXCEL 相關功能簡介

4 資料的組織與彙整 資料依其性質可分: 屬量(quantitative) 屬質(qualitative) 屬量的資料: 呈現事物的數量結果
屬量的資料: 呈現事物的數量結果 例如:考試成績、家庭人口數、家戶所得、經濟成長率等 。 屬質的資料: 標示事物的特徵、屬性、或類別 例如:性別、種族、教育程度、某項物品之所有權等。

5 資料的組織與彙整 排序:將資料依其數值由大到小或由小到大的重新排列。(參見課本表 2.1)
資料一經排序,就可以計算出每一個數值發生的次數(frequency),這些次數合起來即形成一個次數分配(frequency distribution)。 (參見課本表 2.2) 次數分配表的缺點是無法顯示各區間的相對重要性。一個替代方法是改以相對次數 (relative frequency) 來表示。(參見課本表 2.3)

6 資料的組織與彙整 次數占總次數的比重為相對次數,相對次數合起來即形成相對次數分配。
選取不同的區間大小或不同的劃分方式都會導致不同的次數分配。 史特基斯法建議: 當資料觀察值的個數為 n 時,區間的個數 k 大致為 log10 n。 將次數和相對次數分別做累加可得到累積次數分配(cumulative frequency distribution)和相對累積次數分配(cumulative relative frequency distribution)。

7 各種常用圖表的實例 長條圖、直方圖、圓形圖、肩形圖

8 敘述性測度 敘述性測度 (descriptive measure):根據樣本資料中的訊息所綜合整理出來的特定數值,用以描述樣本中某些性質。
常用敘述性測度包括位置測度與變異性測度: 位置測度 (location measure):標示樣本資料整體位置或相對位置 (如大小、高低、輕重等) 的指標。 變異性測度 (variation measure): 衡量資料觀察值之間的變異 (或分散) 程度。

9 位置測度的種類 最大值(maximum):max(a1,a2,a3,…,an)。
最小值(minimum):min(a1,a2,a3,…,an) 。 樣本平均數 (sample mean,sample average): 樣本平均數為所有觀察值加總除以觀察值總個數。 代表資料的中心位置: 任一組觀察值和其樣本平均數的正負差距必互相抵消。

10 位置測度的種類 樣本中位數:樣本經排序後最中間的數。 樣本眾數 (sample mode):一個樣本中發生次數最多的觀察值。
若樣本有 n 個觀察值,當 n 為奇數時,樣本中位數為第 (n+1)/2 個觀察值。 當 n 為偶數時,取中間兩個數值的平均數作為中位數。 樣本眾數 (sample mode):一個樣本中發生次數最多的觀察值。 一個樣本可以不只有一個眾數。

11 簡單實例 假設有 10 筆資料如下: 1,2,3,4,5,6 ,7,8,9 ,9 最大值: 9 最小值: 1 平均數: 5.4
中位數:5.5 眾數:9

12 位置測度的性質 以最小值和最大值作為位置測度的缺點是對樣本資料的掌握不夠全面。
樣本平均數的計算一定用到所有的樣本觀察值,所以可以免除上述缺點,但卻有易受極端值影響的壞處。 樣本平均數不一定是資料的 “中央趨勢” 指標。 樣本中位數和樣本平均數最大的不同在於它不會受極端值的影響。 樣本平均數和樣本中位數皆會隨著資料的位置變動和比例變動而做相同幅度的改變。

13 變異性測度的種類 全距 (range):最大值與最小值的差距。
樣本變異數 (sample variance):樣本觀察值與樣本平均數之間差距平方和的平均。 所描述的是觀察值在樣本平均數周圍的分散狀況。 樣本變異數有兩種算法:

14 變異性測度的種類 樣本標準差 (sample standard distribution):樣本變異數的平方根。
樣本變異數不會受資料位置變動的影響,可是會受資料比例變動的影響而改變。 樣本變異係數 (sample coefficient of variation) : CV= 樣本標準差  樣本平均數 x 100% 好處:不會受資料比例變動的影響而改變。 適合用來比較不同單位的資料間的變異性程度。

15 其他測度—各種分位數 樣本百分位數 (sample percentile):所有觀察值所形成之次數分配的詳細分割。
標示次數分配中, 25%、50%、 75% 位置的三個百分位數,又稱做第一、第二和第三個樣本四分位數(sample quartile)。 樣本四分位距 (sample interquartile range):第一和第三個樣本四分位數兩者的差距。

16 其他測度—百分位數的計算 25% 百分位數的算法:類似中位數。取第 k 和 k+1 個數的平均 ( k 為最接近但小於 (n+1)/4 的數) 。 例如:有 99 筆資料,資料中第 25 小的數值為100,則第一個四分位數就是100。 例如:有 100 筆資料,資料中第 25 小的數值為 100,第 26 小的數值為 102,則第一個四分位數就是 101。 若第一個四分位數為 100,第三個四分位數為 150,則樣本四分位距就是兩者之差 50。

17 其他測度—方塊鬚線圖 方塊鬚線圖 (box-and-whisker plot):以方塊來標示資料中間 50% 的觀察值範圍。
左界:為第一個樣本四分位數,右界:第三個樣本四分位數。 中間的實線:標示樣本中位數。 向左延伸的鬚線端點:樣本最小值。 向右延伸的鬚線端點:樣本最大值。

18 其他測度—幾何平均數 當所有觀察值為正數時,可以計算幾何平均數(geometric mean): 上式兩邊同取對數則得:
為所有觀察值取對數後的算數平均數。 幾何平均數通常用來計算比例 (ratio) 或變動率 (ratio of change) 的平均。

19 電腦軟體的應用 資料的輸入 使用試算表軟體 Excel 來執行敘述統計的工作。
先點選一個儲存格,並在點選的格內鍵入資料,此時按「Enter」鍵 (或點選資料編輯列的「勾號」) 即完成輸入工作。 按「Esc」鍵 (或點選資料編輯列的「叉號」) 即可取消鍵入的資料。 對於已經存在的資料,點選該儲存格後即可進行修改編輯。

20 電腦軟體的應用 資料的輸入 在從事各種資料處理前,必須先選擇試算表中的特定範圍。
首先點選所欲選取的資料範圍最左上角的儲存格 (例如「A1」),然後按住滑鼠左鍵不放並往右下方拉動,直到所欲選取範圍最右下角的儲存格後才鬆開滑鼠左鍵 (例如「B10」)。

21 電腦軟體的應用 產生圖形 直方圖 工具 資料分析 直方圖 輸入範圍 組界範圍 輸出:圖表輸出

22 電腦軟體的應用 產生圖形 由資料直接製作各種圖型 圖表精靈 選取圖型 輸入資料範圍 修正細節 輸出範圍 完成

23 電腦軟體的應用 數學運算 將「A1」與「B10」的資料相加 點選空白儲存格 鍵入 = 點選A1 鍵入 + 點選B10 按 Enter 鍵

24 電腦軟體的應用 使用內建函數: 如「AVERAGE」 數學運算 類別: 統計 點選空白儲存格 點選 fx 名稱: AVERAGE
輸入資料來源 確定

25 電腦軟體的應用 敘述統計 工具 資料分析 敘述統計 輸入資料範圍 確定 輸出: 統計摘要


Download ppt "第一章."

Similar presentations


Ads by Google