第10章 類別資料分析.

Slides:



Advertisements
Similar presentations
比例的檢定(大樣本) 樣本數 n 夠大 ( np ≥ 5 且 n (1 - p) ≥ 5) 時 採用檢定統計量:
Advertisements

變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
第十章 分 配 理 論 INDEX 第一節 所得分配的基本概念 第二節 生產要素的需求 第三節 分配的邊際生產力理論
單元九:單因子變異數分析.
第9章 假設檢定.
卡方檢定 11.1 基本概念 11.2 多項式母體比例的檢定 11.3 齊一性檢定與獨立性檢定 11.4 適合度檢定
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
遞迴關係-爬樓梯.
單元十一、交叉分析表 國立高雄餐旅學院 沈瑞棋.
第 10 章 單組樣本的假設檢定.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
判斷步驟 Step 1 :判斷是否為常態分配 Step 2 :如果是常態分配,用「假設檢定」,如果不是請看 Step 3
第11章 線性相關.
17 類別資料的分析  學習目的.
多元化科學教學策略工作坊 吳木嘉 小學校本課程發展組.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
Regression for binary outcomes
Testing Goodness of Fit 適合度檢定
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
Keller: Stats for Mgmt & Econ, 7th Ed 卡方檢定
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
Inferences Based on a Single Sample: Tests of Hypothesis Chapter 9
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
市佔率之戰,洗髮精準備好了! 施玟如 郭珈吟.
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
第十一章 相關研究法.
第 9 章 假設檢定 Part B ( ).
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
香港快樂指數 2007 何濼生教授 嶺南大學公共政策研究中心.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第一章 直角坐標系 1-3 函數圖形.
第十章補充 允收抽樣.
學習單元:N6 數的性質 學習單位:N6-3 用短除法求H.C.F. 和 L.C.M. 學習重點 : 1. 複習因數分解法求
六9考題(物質循環) 自然界中的二氧化碳會經由哪兩種作用而循環不已? (10%)
How to use Edmodo Alice Lin 8-12th Grade Valencia High School
第 7 章 推論方法.
網頁資料知多少? 事 實 ? 謠言?.
國立台灣體育學院 體育學系暨體育研究所 高明峰
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
3-3 正、反比大挑戰.
微積分網路教學課程 應用統計學系 周 章.
7-2 抽樣分配(sampling distribution)
兩變數間的關係: 名義和次序資料的表格描述
Some Important Probability Distributions
Ogive plot example 說明者:吳東陽 2003/10/10.
流程控制:Switch-Case 94學年度第一學期‧資訊教育 東海大學物理系.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第一章 貨幣的時間價值.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
第十三章 彩色影像處理.
假說檢定程序 3.1 定義 3.2 假說檢定程序 3.3 檢定的種類與方法 3.4 統計檢定精神 個案:假說建立
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
String類別 在C語言中提供兩種支援字串的方式 可以使用傳統以null結尾的字元陣列 使用string類別
有趣的計算 如果令A、B、C、D……X、Y、Z這26個英文 字母,分别等於百分之1、2、3、4……24、
10303: How Many Trees? ★★☆☆☆ 題組:Contest Archive with Online Judge
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
轉動實驗(I):轉動慣量 誰是誰?m, r, I 角加速度α的測量 轉動慣量的測量 轉動慣量的計算~平行軸定理.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第10章 類別資料分析

前言 在社會科學裡面,常會處理類別資料,例如性別、省籍、宗教信仰、居住地區、政黨傾向、投票行為等。 本章介紹類別資料的分析方法,它們是建立在卡方分佈c2上。主要包括四種適用於分析列聯表的卡方檢定:適合度檢定、獨立性檢定、同質性檢定、改變的檢定。

第一節 適合度檢定(1) 當硬幣是公平,丟硬幣100次,出現正反面的次數約在50次左右。現在正反面出現的次數分別為45和55,那麼硬幣是否公平呢? 10年前的社會調查裡,發現女性婚後和公婆同住的意願分別為:願意(5成)、不願意(4成)、非常不願意(1成)。10年後的今天重複這項調查,抽樣1000位女性,發現:願意(4成)、不願意(5成)、非常不願意(1成)。這與10年的調查是否一致?

第一節 適合度檢定(2) 以上這些問題都在回答觀察的分佈是否與期望的分佈一致。例如觀察了硬幣出現的次數分佈,是否符合硬幣公平的期望。觀察女性的意願分佈是否與10年前的分佈相同。 這都是在檢定觀察分佈與期望分佈的適合度,所以稱為適合度檢定。

第一節 適合度檢定(3) Karl Pearson提出他的看法,令Oj表示第j個觀察次數,Ej表示其期望次數,J表示類別數。則 在虛無假設為真(觀察分佈與期望分佈一致)的情況下,且樣本數很大時,X2會近似自由度為J-1的卡方分佈。X2越大就越表示觀察次數與期望次數越不一致。卡方檢定屬於單尾檢定,也就是只有當X2非常大時,才會拒絕虛無假設。

第一節 適合度檢定(4) 例子1 10年前調查女性對與婚後公婆同住的意願,發現:願意(5成)、不願意(4成)、非常不願意(1成)。10年後的今天重複這項調查,抽樣1000位女性,發現:願意(4成)、不願意(5成)、非常不願意(1成)。這與10年的調查是否一致?

第一節 適合度檢定(5) 作法 X2為45,在0.05顯著水準,自由度為2的卡方分佈臨界值為5.99,故拒絕虛無假設。

第一節 適合度檢定(6) 例子2 承上題,如果只是抽樣100人,而不是1000人,結果如表2,是否可以拒絕虛無假設? X2為4.5,小於臨界值5.99, 故無法拒絕。

第二節 獨立性檢定(1) 在上述適合度檢定中,只關心女性的態度。可是有的時候我們可能同時關心男性與女性,例如性別與對婚後與男方父母同住的態度是否有關。本節裡的獨立性檢定(test of independence)就可用於這類的問題。 假設母體有著兩種分類方式,如性別和政黨傾向。透過卡方的獨立性檢定以瞭解這兩種分類是否獨立。首先從這個母體中隨機抽取大小為N的樣本,然後依照性別和政黨傾向加以分類,並分至行和列的細格中,計算各細格的人數。

第二節 獨立性檢定(2) 令Oij表示第i列第j行的觀察值,Eij表示第i列第j行的期望值,Ni+表示第i列的總和,N+j表示第j行的總和,N是樣本數。

第二節 獨立性檢定(3) 基於虛無假設:行和列無關成立的情況下,Eij就是按比例分佈, 即 令O表示觀察值,E表示期望值, 會近似c2分佈,其自由度是(I-1)(J-1)。

第二節 獨立性檢定(4) 例子3 某研究者想瞭解性別和政黨傾向是否有關,隨機抽樣50人,詢問其政黨傾向,性別和政黨傾向有關嗎?

第二節 獨立性檢定(5) X2 = 1.67小於臨界值5.99,因此無法拒絕虛無假設。

第三節 同質性檢定 (1) 獨立性的檢定在探討兩種分類方式是否獨立。同質性檢定在於探討兩個獨立的樣本是否來自同一個母體。這兩種分析方式,在統計處理上完全一樣,抽樣的方法上略有不同。 在獨立性檢定中,只抽取一個樣本。但在同質性檢定中,則是抽取多個樣本。 在實際資料分析上,兩者並無區別。性別若和政黨傾向無關,表示男女在政黨傾向並無不同。

第三節 同質性檢定 (2) 例子4 不同居住地區在「政府施政是否重北輕南」的感受是否不同?

第三節 同質性檢定 (3) X2 = 大於臨界值5.99,因此拒絕虛無假設。

第四節 改變的方向性檢定(1) 廣告商會很想知道他們的廣告是否可以改變消費者的購買行為,教育工作人員也會想知道某種實驗或教學方式是否會改變學生的學習行為,候選人也會想知道某場電視辯論後,選民對他的態度是否變好或變壞。 諸如這些問題,可以用卡方分佈來探討改變的方向性檢定。

第四節 改變的方向性檢定(2) 改變態度的只有B + C人,如果這個實驗對正向改變和負向改變的影響是一樣,在B + C人中應有一半的人產生正向改變,另一半的人產生負向改變。正負向改變的期望值均為(B + C) / 2。

第四節 改變的方向性檢定(3) X2可和自由度為1的卡方分佈來作檢定,如果達顯著水準,就說正向改變和負向不一樣。

第四節 改變的方向性檢定(4) 例子5 隨機抽取100位消費者,調查其購買某品的意願,接著提供該產品試用,最後再詢問其購買意願,讓消費者使用試用產品是有效的策略嗎?

第四節 改變的方向性檢定(5) 作法 試用前後購買態度改變的共30人,其中由會變為不會者5人,由不會變為會的25人。 大於自由度1的卡方分佈於0.05顯著水準的臨界值3.84,因此拒絕虛無假設,宣稱試用產品的策略會改變消費者的購買意願。

第五節 標準化殘差(1) 如果X2很大,就會拒絕虛無假設。可進行事後比較,以便發現哪些細格造成X2變得很大。 檢定每個細格 是否過大的第一種方法是將該值與自由度為1的卡方分佈相比較。 第二種方法就是將 開根號,即 和Z分佈比較。Zij稱為標準化殘差。

第五節 標準化殘差(2) 例子6 某民意調查機構抽樣電話訪問了899位成人,詢問其將會選2位候選人中的哪一個。

第五節 標準化殘差(3) 每格細格的 進行事後比較,在自由度為1,0.05的顯著水準下,卡方分佈的臨界值為3.84。因此只有「外省/1號」的細格不吻合虛無假設(省籍與支持度無關)。

第五節 標準化殘差(4) 每個細格的標準化殘差 Z分佈的臨界值為1.96,只有「外省/1號」的細格不吻合虛無假設。由於殘差是負的,表示觀察次數小於期望次數。換句話說,外省籍的人士明顯的不支持1號候選人。

第六節 期望值的大小(1) 本章所述的卡方檢定建立在利用多變項常態分佈代替多項式分佈的基礎上每個細格的期望次數也應很大,才能以卡方分佈進行檢定。 如果是適合度檢定,每個細格期望次數要大於10。如果是獨立性檢定或同質性檢定,每個細格期望次數要大於5。如果有四分之一以上的細格期望次數小於5,那就不適用卡方檢定。

第六節 期望值的大小(2) 解決期望值太小的方法 1. 再抽樣調查以補足資料 2. 去掉期望值小於5的類別 3. 將類別加以合併

第七節 關連強度的測量(1) 一旦發現了行與列有關連,接下來要回答的問題就是:關連強度有多大。通常可用下列幾種指標:列聯係數、f 相關係數、fC 相關係數、Kappa係數。

第七節 關連強度的測量(2) 列聯係數 其中X2為計算的卡方值,n為樣本數。C的最小值為0,但最大值為 ,其中K是列數I和行數J中的較小者。

第七節 關連強度的測量(3) f 相關 對於22的列聯表而言: 若調查性別(男、女)與省籍(本省、外省)的關係。然後將性別定義為X變項,省籍為Y變項。X和Y變項都是二元變項,計算積差相關會等於f。可以用積差相關的觀念來解釋f。 fC相關 對於不是22的列聯表而言:

第七節 關連強度的測量(4) 例子7 承例子6,省籍與投票傾向的關連強度有多大? 作法 X2 = 13.56,列聯係數 f 相關為

第七節 關連強度的測量(5) Kappa(k) 兩位評審的一致程度有多大?

第七節 關連強度的測量(6) 對角線的次數就是這兩位評審看法一致的件數。在100件作品裡,共有80件作品的看法一致。因此這兩位評審的一致性高達0.8(= 80 / 100)。 事實上,即便兩位評審的看法完全無關,因為機率的原因,對角線也會存在某些次數。因此在計算兩位評審的一致性,應該扣除這些次數。

第七節 關連強度的測量(7)