类别资料分析 Categorical Data Analysis 王德育 (T. Y 类别资料分析 Categorical Data Analysis 王德育 (T.Y. Wang) 伊利诺州立大学 (Illinois State University) tywang@ilstu.edu 1 1
本课程旨在说明如何以不同 的回归模型来分析『类别依 变量』(categorical dependent variables) 课程简介: 本课程旨在说明如何以不同 的回归模型来分析『类别依 变量』(categorical dependent variables) 2 2
变量的种类: 连续变量(continuous variables) 类别变量(categorical variables):具有穷尽且互 斥的类别或记录某种现象 发生的次数
类别变量的种类: Binary variables (二分类变量) 只包含两个类别,一个类别 指出某一事件「有」发生或 具「有」某种特质,而另一 个类别则指出某一事件「没 有」发生或「没有」某种特 质
e.g.,有没有在最近一次居 委会选举中投票?已婚还 是未婚?是不是共产党党 员?有没有宗教信仰?对 某件事是同意还是不同意?
Ordinal variables (有序多分 类变量):通常有两个以上 的类别,这些类别具有等级 而可以排列出高低
您对自己目前工作的满意程 度是怎样的呢? 非常不满意 不满意 一般 满意 非常满意
教育水平可分为「小学及 以下」 、「初中」 、 「高中」 、「大学」 、 与「研究生及以上」 收入可分为「上等水 平」 、「中等水平」与 「下等水平」
Nominal variables (无序多分类变量):这类变量通常有两个以上的类别,但是这些类并不具有等级,所以不能排序
工作单位性质可分为「党政 机关」、「国有企业」 、「 集体企事业」 、「个体经营 」 、「三资企业」 、以及「 其他企业」 受访人的政治面貌可分为「 中共党员」 、「民主党派」 、与「无党派」
Count variables (次数变量): 是指某事件发生的次数,从0 到正无穷大 美国总统否决法案的次数 某教授发表论文的篇数 非洲国家发生政变的次数
当依变量为连续变量时,我 们一般可以线性模型来执行 回归分析
J. Scott Long著,郑旭智等译,2002.《类别 与受限依变项的回归统计模式》,台北 :弘智文化事业有限公司 Readings J. Scott Long and Jeremy Freese. 2006. Regression Models for Categorical Dependent Variables Using Stata (College Station, TX: Stata Corporation) J. Scott Long. 1997. Regression Models for Categorical and Limited Dependent Variables (Thousand Oaks, CA: Sage Publications) J. Scott Long著,郑旭智等译,2002.《类别 与受限依变项的回归统计模式》,台北 :弘智文化事业有限公司 13 13
Review of Classic Regression