類別資料分析(Categorical Data Analysis) 單元: 簡介 中華大學餐旅管理系羅琪老師
變數 定性 定量 不連續 連續
變數的類型(Types of variable) 資料或變數可以分成兩類: 定性變數(qualitative variable) 或稱為類別變數(categorical variable) 定量變數(quantitative variable)
定性變數(qualitative variable) 定性資料包含標記或名稱,用來代表元素的所屬類別 定性資料的值可以是數字也可以是非數字的,但數字沒有數量的意義
定性變數 例: 性別(1-男, 2-女) 血型(1-O, 2-A, 3-B, 4-AB) 教育程度(1-高中以下, 2-高中職, 3-大專, 4-研究所) 婚姻狀態(1-已婚, 2-未婚) 是否有XX疾病?(1-是, 0-否) 是否有高血壓?(1-是, 0-否) 是否有糖尿病?(1-是, 0-否)
定量變數(quantitative variable) 定量資料都是數字的,且數字都有數量的意義 只有當資料為定量時,算術運算才有意義
定量變數 例: 年齡 BMI(體重(公斤) / 身高 2 (公尺 2)) 血壓 收入 小孩數 IQ分數 懷孕次數 員工數(醫生數+護理師數+行政人員數+其他員工數)
連續與不連續變數 定量變數可根據數值的範圍,進一步分成連續與不連續的 當變數的所有可能值的集合是一個區間,則此變數是一個連續的變數 例: 身高、體重、年齡、血壓、時間、分數、 收入、溫度
連續與不連續變數 當變數的數值只能用自然數或整數單位計算,其所有可能值的集合是有限的(finite) 或可數的(countable),則此變數是一個不連續的變數 例: 員工人數、設備台數、子女數、事件發生 的次數(中獎、意外)
注意 年齡、收入 …等變數應該是連續的定量變數 但有時做問卷時,為了隱私或方便,常將年齡、收入分組,分組後變數成為是定性變數 例: 收縮壓(<127, 127-146, >146) 年齡(<20歲, 20-40歲, >40歲) 膽固醇(<200, 200-219, 220-259, >259)
統計模式(Statistical Models) Y-反應變數(response variable), 因變數(dependent variable) x1, x2, …, xk-解釋變數(explanatory variables), 自變數(independent variables) 統計模式-用來分析反應變數如何被解釋變數所影響
統計模式 x1, x2, …, xk 解釋變數 類別變數 定量變數或混和 Y 反應 變數 類別 Contingency Table 列聯表 Log-linear Model 對數線性模式 Logit Model 羅吉斯迴歸模式 定量 ANOVA Model 變異數分析模式 Regression Model 迴歸分析模式
統計模式範例 列聯表 Y-是否曾接受乳房攝影(1-是, 0-否) x1-篩檢年齡(30-34, 35-39, >=40) 類別變數 類別變數
統計模式範例 羅吉斯迴歸 Y-洗腎病人是否有腦血管疾病(1-是, 0-否) x1-病人的年齡 x2-洗腎型態(1-血液透析, 0-腹膜透析) 類別變數 混和
統計模式範例 迴歸分析 Y-平均睡眠時間 x1-性別(1-男, 0-女) x2-壓力(0-無壓力, 1-壓力中等, 2-壓力大) x3-年齡 定量變數 混和
統計模式範例 變異數分析 Y-體重改變 x1-飲食療法(0-無飲食療法, 1-飲食療法A, 2-飲食療法B) x2-性別(1-男, 0-女) 定量變數 類別變數
付出最多的人,也是收穫最多的人 ~共勉之~