描述統計 Descriptive Statistics

Slides:

Advertisements

Similar presentations

©2009 陳欣得統計學 —e1 微積分基本概念 1 第 e 章微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.

Advertisements

林惠玲陳正倉著雙葉書廊發行 2009 第 4 章分析資料 - 以統計測量數呈現 1 統計學方法與應用四版上冊第 4 章分析資料 - 以統計測量數呈現.

單元九：單因子變異數分析.

資料整理與圖表編製內容說明：教師與學生互動練習，熟習資料整理與圖表編製。.

資料整理與圖表編製內容說明：教師與學生互動練習，熟習資料整理與圖表編製。.

Ch12 資料分析.

項目分析與信度估計（Item Analysis and Reliability Estimation ）

樞紐分析與資料庫蕭世斌 Nov 20, 2010.

Measures of location and dispersion

統計學(Statistics) 其目的應用.

二、以圖表描述資料 2. Charts & Graphs.

量化研究與統計分析 Data Graphing 國立臺灣體育運動大學高明峰

參考書籍：林惠玲與陳正倉（2002），應用統計學（第二版）。台北：雙葉書廊有限公司。

應用統計理論編著：劉正夫教授 Reference：1) Wonnacott and Wonnacott. Introductory

數據分析林煜家魏韶寬陳思羽邱振源.

第二部份 SPSS操作程序與方法資料處理與數據查核.

3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量

第四章　數列與級數 4－1　等差數列與級數 4－2　等比數列與級數 4－3　無窮等比級數下一頁總目錄.

統計量 (一) 大綱:算術平均數中位數眾數顧震宇台灣數位學習科技股份有限公司.

資料的整理與呈現表格化法與製圖法中心位置測定值分散度測定值變異係數

第五章　標準分數與常態分配第一節　相對地位量數第二節　常態分配第三節　偏態與峰度第四節　常態化標準分數第五節　電腦習作.

量化研究與統計分析 Data Graphing

Chap3 Descriptive statistics -numerical measures Minitab & Excel

第3章資料的整理與表現- 統計表與統計圖.

第 5 章樣本資料的數值分布.

課程九迴歸與相關2.

邏輯迴歸 Logistic Regression

第一章敘述統計學.

敘述統計 2.1 次數分配 2.2 統計量數個案：樣本敘述商管研究資料分析SPSS的應用 Chapter 2 敘述統計.

單一分配 Uniform distribution

本章重點：一、集中量數的意義和種類二、算術平均數三、中位數（中數）四、眾數五、其他集中量數六、SPSS12.0實務操作

統計量數集中趨勢量數離散趨勢量數相對位置量數分配形態量數.

第2章集中量數.

敍述統計學許明宗.

第 3 章敘述統計II：數值方法 Part A (3.1~3.2).

Review 統計方法的順序確定目的蒐集資料整理資料分析資料推論資料 (變量，對象) (方法：普查，抽樣)

第十一章相關研究法.

第一章直角坐標系 1－1　數系的發展.

第一章敘述統計學 1.1 原始資料 1.2 統計表 1.3 統計圖 1.4 統計量值一些經驗法則 44 ©2009 陳欣得

第3章變異量數與分佈形狀.

第一章直角坐標系 1-3　函數圖形.

小學四年級數學科 8.最大公因數.

信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.

田口方法應用於語音辨識報告者:李建德.

7-2 抽樣分配（sampling distribution）

Dr. C. Hsieh College of Informatics Kao yuan University

第五章估計與信賴區間 5.1 估計概論估計量的分配信賴度、信賴區間與最大容忍誤差16

Chapter 5 z-Scores.

第三章敘述統計量.

Review of Statistics.

Chapter 4 Variability 離散趨勢測量 2019/4/26.

生物統計與SAS軟體課程教學(二) 單變項描述 (Descriptive Statistics)

（四）标准差(standard deviation)

楊志強博士統計學楊志強博士

楊志強博士國立台北教育大學系教育統計學楊志強博士國立台北教育大學系

第八章銷售預測(2).

第十四章名義資料的數字描述：關連測量 © Copyright 版權所有：學富文化事業有限公司。本光碟內容僅提供教師於教學上使用，非經本公司許可，禁止複製 (給學生)。感謝老師的配合。

第七章資料轉換和個案選擇 7.1 前言 7.2 〝Recode〞功能 7.3 〝Compute〞功能 7.4 〝Count〞功能

第四章統計資料的整理:統計量數.

課程三描述統計：次數分配、中央趨勢.

資料表示方法資料儲存單位.

因數與倍數.

第一章直角坐標系 1－3　函數及其圖形.

4-1 變數與函數第4章一次函數及其圖形.

單元三：敘述統計內容：＊統計量的計算＊直方圖的繪製.

11621 : Small Factors ★★☆☆☆ 題組：Problem Set Archive with Online Judge

17.1 相關係數判定係數：迴歸平方和除以總平方和相關係數判定係數：迴歸平方和除以總平方和.

第三章比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.

Presentation transcript:

描述統計 Descriptive Statistics 量化研究法二統計原理與分析技術第2章描述統計 Descriptive Statistics

描述統計概說描述統計的定義一套用以整理、描述、解釋資料的系統方法與統計技術數據從初始狀態（raw data）成為可被理解的統計量數（statistic）的一套操作程序透過統計量數來描述大量資料，並作為彼此溝通的共同符號語言

量化數據的處理統計圖表描述統計量運用次數分配表來整理並描繪變數數值分佈情形利用統計圖表來表現出數據的特性與分佈情形統計量（statistic）：由樣本所獲得的原始資料所計算推導出的統計量數當統計量由樣本所獲得的數據計算得出，是描述樣本數據特性的最佳指標，通常以英文字母表示，例如與s。當統計量由母體數據，描述統計所產生的量數稱為參數或母數（parameter），用以描述母體數據的分佈特性，通常以希臘字母表示，例如μ與σ。

次數分配功能傳統作法提供原始資料的基本資訊作為資料檢查的判讀工具提供統計技術選擇與如何分析的線索將原始資料進行初步分類以人工劃記方式編碼（coding），具有類別、次數、累積次數、百分比等訊息的次數分配表基本欄位變項數值（value）：位置於左側數值次數（frequencies）：位置於右側

以人工劃記所製作的次數分配表

SPSS製作的次數分配表

分組次數分配表組數以10至20組之間為宜，組距則以2、5、10三個可將10整除的因數為宜。組數越多表格越大，但是資訊較豐富，組數越少表格越精簡，但遺失的資訊較多。

次數分配各相關名詞 ■次數分配（frequency distribution）：由某個變項各數值（各組）的次數所組成的分配，如前表的第一欄。 ■相對次數分配（relative frequency distribution）：由某個變項各數值（各組）的次數除以總數（稱為相對次數）所組成的分配。如果把相對次數乘以100%，即為百分比分配，如前表的第二欄。 ■有效百分比分配（valid percentage frequency distribution）：由某個變項各數值（各組）次數除以扣除遺漏值的次數乘以100％後的分配，如前表的第三欄。（在沒有遺漏值的情況下，有效百分比分配等於百分比分配） ■累積次數分配（cumulative frequency distribution）：由某個變項各數值（各組）的次數往上或往下累計所組成的分配。 ■累積相對次數分配（cumulative relative frequency distribution）：由某個變項各數值（各組）的次數除以總數，以往上或往下累計所組成的分配。如果把相對次數乘以100%後再累計，即為累積百分比分配，如前表的第四欄。

集中量數（measures of central location）用以描述一組數據或一個分配集中點的統計量數一個能夠描述數據的共同落點的指標。常用的集中量數有平均數、中位數及眾數

平均數平均數（mean；以M表示）取某一變項的所有數值的總和除以觀察值個數所得到的值因為是將數據直接以數學算式來計算平均值，又稱為算術平均數（arithmetic mean）。母體資料得出的平均數需以希臘字μ表示樣本資料得出的平均數以表示

中位數中位數（median；或以Mdn表示）又稱為中數、百分等級為50的百分位數（P50）或第二四分位數（Q2; second quartile）。將某一個變項的數據依大至小或由小至大排列，取位居最中間、或能夠均勻對分全體觀察值的分數在中位數之上與之下，各有50%的觀察值。 50、55、60、60、60、65、66、70、90 50、55、60、60、60、65、66、70、90 、95 62.5

眾數眾數（mode；或以Mo表示）一組分數中，出現次數最多的一個分數一組數據中最典型（typical）的數值或次數分配最高點所對應的分數是各集中量數當中，最容易辨認的量數一個分配有兩個分數具有相同的最高次數，此時即出現了雙眾數，稱為雙峰分配（bimodal distribution） 50、55、60、60、60、65、66、70、90

集中量數的特性與優缺點比較

三種集中量數與分配形狀的關係

變異量數（measures of variation）或離散量數用來描述觀察值在某一個變項上的分數分散情形的統計量描述統計中，集中量數必須搭配變異量數，才能反應一組數據的分佈特徵常用的變異量數包括全距、四分差、變異數及標準差

全距全距（range）一組分數中最大值（Xmax）與最小值（Xmin）之差是一群分數變異情形最粗略的指標全距容易計算，適用性高，可以應用在名義變項與順序變項，來求出變項當中類別的多寡。缺點是不精確也不穩定，無法反應一個分配的每個數值的狀態。

四分差（semi-interquartile range; QR）是一組數據當中的第三四分位數（區隔高分端的前25%的分數，簡稱Q3）與第一四分位數（區隔低分端的後25%的分數，簡稱Q1）距離的一半中間百分之五十的樣本分數差距的二分之一

離均差與平方和離均差離均差平方和（sum of squares; SS）一組數據中，各分數與平均數的距離，通常以小寫的x來表示當離均差為正值時，表示分數落在平均數的右方離均差為負值時，表示分數落在平均數的左方平均數是每一個分數加總後的平均值，為一組分數的重心位置離均差平方和（sum of squares; SS） SS的概念可以類比為面積的概念，表示分數與平均數變異的面積和 deviation score= x =(X - μ)

變異數標準差以或MS（mean square）表示為平均化的離均差平方和變異數的開方，以σ表示。標準差或變異數越大者，表示該分配的變異情形較大。

變異數的不偏估計數（unbiaed estimator）標準差與變異數的不偏估計數的主要差別在於分母項為N-1而非原來的N N-1稱為自由度（degree of freedom；df），表示一組分數當中，可以自由變動的分數的個數。在離均差的計算上，自由度為樣本數減1，表示在N個觀察值中，只有N-1個數字可以自由運用於離均差的計算。

變異係數（coefficient of variation）可去除單位對於變異量數放大作用變異係數（coefficient of variation）來去除單位對於變異量數放大作用 CV值是把標準差除以平均數，是一個沒有單位的比值，也稱為相對差或相對差異係數（coefficient of relative variability）變異係數是用來反應各變項變異狀況的良好指標

變異量數的特性與優缺點比較

偏態描述一個變項的對稱性（symmetry）的量數稱為偏態係數不對稱的資料稱為偏態資料，依其方向可分為負偏（negatively skewed）（或左偏，即左側具有偏離值）、正偏（positively skewed）（或右偏，即右側具有偏離值）與對稱（symmetrical）三種情形

三級動差（m3）可反應偏態情形

地板與天花板效應地板效應（floor effect）天花板效應（ceiling effect）指數據多數集中在偏低的一端，但在高分端則有極端值，分數不容易突破低分端，但會往高分端延伸，彷彿有一個地板（或真的存在一個低分限制條件）阻擋了數據往低分移動。由於地板阻隔作用，地板效應常伴隨正偏態現象。天花板效應（ceiling effect）則與負偏態有關，是指數據多數集中在偏高的一端，但在低分端則有極端值，分數不容易突破高分端，彷彿有一個天花板（或真的存在一個高分限制條件）阻擋了數據往高分移動。

峰度是指一個次數分配集中部份的陡峭程度。兩個分配都是對稱的單峰鐘型曲線時，並不一定具有一樣的平坦或陡峭形態（峰度）。一個對稱的鐘型分配，變項的數值會集中於眾數所在位置，如果集中於眾數附近的分數多，分散於兩側的分數少，將形成高狹峰（leptokurtic）的分配當集中於眾數附近的分數較少，兩側分數多，則形成低闊峰（platykurtic）。在常態分配時的理想峰度稱為常態峰（mesokurtic）。

g2係數為標準分數取四次方後的平均值。值得注意的是小樣本時，g2也非不偏估計數，因此求樣本的峰度時多以來計算峰度。隨著樣本數的擴大，g2與數值逐漸接近而無差異。

偏態與峰度係數的特性偏態與峰度係數是一種標準分數的概念，因此不受分配變異程度的影響而可相互比較偏態與峰度係數具有標準分數的特性，因此均以0為常態值，也就是說，當g1與g2（或不偏估計係數）為0或接近0之時，次數分配可以說是一個對稱、不偏的常態峰分配偏態與峰度係數在正負0.5到1之間是為偏態或特殊峰度，超過正負1的偏態與特殊峰度情況即屬嚴重。嚴重的偏態與峰度會影響統計分析的運用。

在視窗版SPSS中，可以用來建立次數分配與計算描述統計量的功能指令很多：分析→描述性統計→次數分配表分析→描述性統計量分析→報表→觀察值摘要其他在各種統計分析功能中，亦可報告描述統計量的資料。有關百分等級的換算，可利用轉換當中的等級觀察值來執行。