第七章 交叉分析表.

Slides:



Advertisements
Similar presentations
北京市卫生和计划生育委员会. 目录目录 2 1 汇审工作安排 2 年末结账及明年建账关注事项 3 卫生年报口径讲解 4 财政决算口径讲解.
Advertisements

实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
组长:倪运超 小组成员:徐悦、曹吕卿、孙浩、徐圣尧.  上海的历史 上海的历史  上海的历史 上海的历史  上海的文化 —— 建筑 上海的文化 —— 建筑  上海的文化 —— 美食 上海的文化 —— 美食  香港的历史 香港的历史  香港的历史 香港的历史  香港的文化 —— 建筑 香港的文化.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
一、 突出解析几何复习中的重点问题的通法通解 解析几何中的重点问题 一、 突出解析几何复习中的重点问题的通法通解 直线与圆锥曲线的位置关系 重点一.
中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
國中教育會考 十二年國教—免試入學 及 意見整理.
探究实验的教学设计和教学策略 ENTER 余杭勾庄中学 郭 琳
第十三章 中国的传统科学技术 中国古代的科技曾经长期处于世界领先地位,对人类文明的进步作出过重要贡献,并形成了富有特色的科技文化。在今天,源自中国古代科技文化的中医学仍然在现实生活中发挥着积极的作用。
第七讲 第3章 Office 2000_Excel 2000(二)
第十二章 小组评估 本章重点问题: 评估的设计 测量工具的选择和资料的收集 与分析.
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
第四章 账户及复式记账的应用 教学目的与要求:本章内容属于会计实务部分。通过本章的教学,使学生掌握制造企业经济业务的核算内容及账务处理,进一步加深对复式记账原理的理解,熟练掌握借贷记账法在制造企业的实际应用。 教学重点:运用借贷记账法对制造企业的经济业务进行账务处理。 教学难点:利润的核算;期末各账户之间的相互结转。
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
说课课件 感悟工业革命力量,闪耀科技创新光辉 ----《走向整体的世界》教学设计及反思 爱迪生 西门子 卡尔·本茨 诺贝尔 学军中学 颜先辉.
普 通 话.
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
1. 晨昏的陽光是最好的肝藥 ◎曬太陽有助提升肝功能 經常超過晚上11點睡覺的朋友一定要看喔!
合 同 法 主讲人: 教材:《合同法学》(崔建远) 2017/3/10.
小学语文毕业总复习 ( 基础知识部分) 牡丹区实验小学侯宪梅.
腸道傳染病宣導講座 南港區健康服務中心 林治萱護理師.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
探討某醫院志工 中華醫事科技大學 參與服務動機影響因子 指導老師: 趙 海 倫 老 師 班 級: 四 醫 管 四 A
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
雄伟的金字塔.
美国史 美利坚合众国创造了一个人类建国史的奇迹,在短短230年的时间从一个被英帝国奴役的殖民地到成为驾驭全世界的“超级大国”、“世界警察”,美国的探索为人类的发展提供了很宝贵的经验。
“三项制度+一个平台”构建 省级高校教学质量监控体系
瓯海职专财经专业组简介.
国有资产清查 数据填报操作规范 2016年3月25日.
全省水产技术推广补助项目 信息员培训 河南省农业厅水产局 2013年11月17日.
人力资源规划方案 人力资源规划项目组 2005年4月9日.
本章重點 6-1 以填滿方式輸入員工編號 6-2 計算總成績 6-3 員工成績平均分數 6-4 排列員工名次 6-5 查詢各個員工成績
第 19 章 規劃求解求算最大利潤 著作權所有 © 旗標出版股份有限公司.
上海文会会计师事务所有限公司 中国注册会计师 童幸义
江苏如皋钢铁有限公司 行车司机、起重司索指挥人员安全知识培训 部门(单位)名称:安环部 李雄飞
提示语、广告词 颁奖词、衔接语 感谢信、通告启事 图文转换
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
仓储企业岗位人员招聘 第一组 组员 :陈娇娇 祝婷婷 丁元莉 袁珮 王慧.
赵德成 北京师范大学教育管理学院 让教师成为研究者 赵德成 北京师范大学教育管理学院
独特的建筑—信息的获取与应用 大 屯 中 学 王 伟 娜.
人口与计划生育 统计分析 昌吉市计划生育委员会 二○○六年三月.
开 学 第 一 课 六年级3班.
2014年深圳市学生人身意外伤害保险投保工作介绍 中国人民财产保险股份有限公司深圳市分公司
汽 车 文 化.
传媒学院2013年度团委工作 总结分析报告
建國國小英語教學線上課程 字母拼讀篇(一) 製作者:秦翠虹老師、林玉川老師.
八、电路的三种状态 通路: 开路: 用电器短路 短路: 电源短路.
专业教师成绩录入指南 及教学文档材料归档要求
習作2-2 題目+解答 第一關 西亞、中亞的自然與人文環境 圖一  歐洲分區簡圖      請依據圖一中的標示,將正確代號填入空格中。   
规范教学,提升质量,迎接评估 ——学校教学管理制度解读
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
Excel文書常用技巧 電算中心 薛明政 2012/10/22.
科 展 說 明.
第十四章 迴歸.
國二EXCEL專案 上機考試版本: 主講者:黃韋欽 老師 考試者:國二全體學生.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
成本会计学.
舊生升級編班與新生管理操作說明 全誼資訊股份有限公司 中華民國106年06月05日.
4. 曾文水庫越域引水環評報告彙整 資料來源: 1. 曾文水庫越域引水下游輸水工程環境影響差異分析暨環境現況差異分析及對策檢討報告(定稿本)
Excel 2007 电子表格基础知识.
第一章 概說.
新课程理念下如何进行课堂教学 刘志超 2014年2月25日.
第十三章 資料表格化與整理:Excel 2000的使用
6 分析資料-以統計測量數呈現.
Presentation transcript:

第七章 交叉分析表

交叉分析表 市場調查或民意調查,常利用交叉分析表來以探討兩個類別變數間之 關聯性(如:地區別與某政策之贊成與否、性別與偏好政黨、教育程 度與使用品牌、品牌與購買原因、所得與是否有數位相機、……)。 於Excel中,交叉分析表係利用『樞紐分析表』或『假設狀況分析/資 料表』來建立。不過,還是以前者較為簡單。所以,我們就僅介紹 『樞紐分析表』。

建立樞紐分析表 茲以範例Ch07.xlsx『政黨傾向與地區別』工作表為例,進行說明建立 交叉分析表之過程,該表有1000筆受訪者之資料,各欄內之代碼意義 請參見表內文字說明。

以滑鼠單按問卷資料之任一儲存格 切換到『插入』索引標籤,按『表格』群組『樞紐分析表』鈕, 轉入『建立樞紐分析表』對話方塊

於上半部,選「選取表格或範圍(S)」,其內所顯示者恰為薪資資料之範圍 (Excel會自動判斷正確範圍,若有不適,仍可自行輸入或重選正確之範圍) 於下半部,選「已經存在的工作表(E)」項,續選按L3儲存格。表欲將樞紐分 析表安排於目前工作表之L3處

按 鈕,續利用捲動軸,轉到可以看見L3儲存格之位置,可發現 已有一空白的樞紐分析表,且右側也有一個『樞紐分析表欄位清單』窗格

於右側『樞紐分析表欄位清單』窗格上方之『選擇要新增到報表的欄位:』 處,以拖曳之方式,將『□ 居住地區』拉到『欄標籤』方塊;將『□ 政黨傾 向』項拉到『列標籤』方塊;將『□ 性別』拉到『Σ值』方塊,可求得初始 樞紐分析表,表內所求算之統計量,其預設值為求算選取欄位(性別)之加 總。因為,係要求人數(即項目個數),故將那一個欄位拖曳到『Σ值』方塊, 均不影響本例之求算動作。

於『Σ值』方塊,單按『加總-性別』項右側之向下箭頭,續選「值欄位設定 (N)…」,轉入『值欄位設定』對話方塊

於『摘要值欄位方式(S)』處將其改為「項目個數」,以求算出現次數(即記 錄數);續於上方『自訂名稱(C)』處,將原內容改為『人數』

按 鈕,L3儲存格處之樞紐分析表已改為人數

利用捲動軸按鈕,將表格調往螢幕左上角,以節省畫面空間。點按M3儲存格, 將其『欄標籤』字串改為『居住地區』;點按L4儲存格,將其『列標籤』字 串改為『政黨傾向』,於M4:P4輸入各數字所對應之居住地區,於L5:L10輸 入各數字所對應之政黨名稱,以利閱讀 輸入時,得逐格輸入,無法一次複製多格內容。

按 或 之向下箭頭,可就如下式之選單:

選擇要保留或取消那一類別之資料,續按 鈕,樞紐分析表可立 即改成最新之交叉結果:(假定,取消政黨傾向為「無」之類別)

馬上練習 針對範例Ch07.xlsx之『政黨傾向與性別』工作表,求政黨傾向交叉性 別之樞紐分析表。

馬上練習 針對範例Ch07.xlsx『品牌交叉偏好原因』工作表,求品牌交叉偏好原 因之樞紐分析表。

加入百分比 總百分比 各儲存格之數字除以總樣本數 欄百分比 各欄內之儲存格數字除以該欄總樣本數 列百分比 各列內之儲存格數字除以該列總樣本數 就算求得前述之樞紐分析表,我們也不太會分析。得再加入百分比資 料,才方便解釋。於表中可加入三種百分比: 總百分比 各儲存格之數字除以總樣本數 欄百分比 各欄內之儲存格數字除以該欄總樣本數 列百分比 各列內之儲存格數字除以該列總樣本數 假定,欲於原建立之『政黨傾向交叉居住地區』交叉表內,加入欄百 分比。其操作步驟為:(詳範例Ch07.xlsx『加入欄百分比』工作表) 以滑鼠單按樞紐分析表內任一儲存格

於右側『樞紐分析表欄位清單』窗格上方之『選擇要新增到報表的欄位』處, 以滑鼠拖曳『□ 性別』欄位。將其拉到右下方之『Σ值』方塊內,『人數』 項目之下。所增加之內容,目前係加於原各欄之右側

以滑鼠拖曳『欄標籤』方塊內『Σ值』項目,將其拉到『列標籤』方塊內, 『政黨傾向』項目之下

按右下方『Σ值』方塊內,『加總-性別』項右側之向下箭頭,續選「值欄位 設定(N)…」,轉入『值欄位設定』對話方塊,於『摘要值欄位方式(S)』處 將其改為「項目個數」,以求算出現次數,另於『自訂名稱(C)』處,將原內 容『加總-性別』改為『%』

切換到『值的顯示方式』標籤

按『值的顯示方式(A)』下方之向下箭號,選取使用「總欄數的百分比」 按 鈕,獲致含人數及縱向百分比之交叉分析表

馬上練習 針對範例Ch07.xlsx『政黨傾向與性別之欄百分比』工作表,求政黨傾 向交叉性別之樞紐分析表,同時顯示人數及其縱向之欄百分比,並解 釋其結果。

馬上練習 針對範例Ch07.xlsx『品牌交叉偏好原因之欄百分比』工作表,求品牌 交叉偏好原因之樞紐分析表。於表中同時顯示人數及其縱向之欄百分 比,並解釋其結果。

加入篩選依據 樞紐分析表內,尚允許加入分頁項目(如:性別),作為交叉表的上 一層分組依據,以便查閱不同性別,各地區的政黨傾向。 假定,欲續於前文之樞紐分析表內再加入『性別』作為分頁依據。其 處理步驟為:(詳範例Ch07.xlsx『加入篩選依據』工作表) 以滑鼠單按樞紐分析表內任一儲存格 於右側『樞紐分析表欄位清單』窗格上方之『選擇要新增到報表的欄 位』處,以滑鼠拖曳『性別』欄位。將其拉到『報表篩選』方塊內, 即可完成加入篩選依據之設定,獲致新的樞紐分析表

以「性別」為篩選依據之樞紐分析表,會於上方加有一下拉式選擇表 目前其上顯示「(全部)」,故樞紐分析表內,所顯示者為全部資料的交叉表 分析結果。欲查閱不同性別資料時,可單按右側之向下箭頭,將顯示各性別之 內容以供選擇: 選妥後,按 鈕,樞紐分析表內容將轉為僅顯示該性別之內容而已。 如,僅過濾出「1」(男性)之資料而已:

馬上練習 為範例Ch07.xlsx『加入地區別篩選』工作表中之交叉表,加入以『居 住地區』當篩選依據,僅顯示居住地區為『南區』(3)之結果,並加 以解釋。

變更樞紐分析表的版面配置 欲變更樞紐分析表的版面配置,如:將樞紐分析表資料進行轉軸(移 轉欄列方向)或移動資料項位置,均可以直接拖放欄位方式,來更改 樞紐分析表資料的版面配置。當重新組織樞紐分析表的資料時,它會 自動重新計算,且不影響來源資料。

欄列位置互換 欲將樞紐分析表進行轉軸(移轉欄列方向),其處理步驟為:(詳範 例Ch07.xlsx『欄列位置互換』工作表) 以滑鼠單按樞紐分析表內任一儲存格

於右側『樞紐分析表欄位清單』窗格,以滑鼠拖曳方式,將『欄標籤』與 『列標籤』之內容互換位置,欄/列內容即已互換:(目前L5:L8之欄標籤內 容為各地區別,只是L4之標題仍為"政黨傾向";M4:R4之列標籤內容為各政 黨別,只是M3之標題仍為"居住地區")

將L4之標題改為"居住地區",M3之標題改為"政黨傾向",使標題與其內容相 符

移動樞紐分析表資料項目 移動樞紐分析表資料項目位置,當然可於『樞紐分析表欄位清單』窗 格之『Σ值』方塊,以拖曳方式進行移動位置。但也可以於樞紐分析表 上,直接以滑鼠進行拖曳! 於範例Ch07.xlsx『移動資料項目』工作表之樞紐分析表,若欲將『人 數』與『%』兩資料項,進行互換位置:

以滑鼠單按L6之『人數』標題 將滑鼠移往『人數』標題之上緣框邊,指標將由空心十字轉為四向箭頭,按 住滑鼠拖曳,拖到『%』標題之下,再鬆開滑鼠,將可獲致已移妥資料項目 的新樞紐分析表

區間分組 無論是文字、日期或數字,於樞紐分析表中,均是將不重複出現之內 容視為一個類別,去求算交叉表之相關統計數字。當碰上重複性較低 之日期或數字,很可能每一個數值均是唯一,而產生幾乎無法縮減其 類別之情況。 如,範例Ch07.xlsx『運動時間未分組』工作表,性別交叉每次運動時 間之結果,有很多種時間係獨立存在產生一列內容,由於組數太多, 於資料分析時並無多大作用:

較理想之方式為將毎次運動時間分組,以縮減其組數。假定,要將毎次運動時 間分為0~30、31~60、61~90、91~120與121~五組。可於資料表尾部,新增 一『時間分組』欄以 =IF(C2<=30,1,IF(C2<=60,2,IF(C2<=90,3,IF(C2<=120,4,5)))) 之運算式,將其分為六組。重建一次樞紐分析表,即可得到經縮減組數後之交 叉表:(詳範例Ch07.xlsx『性別交叉運動時間-分組』工作表)

將F5:F9時間分組與G4:H4性別之數字改為字串,將更易判讀樞紐分析表之內 容: 當然,也可以前文之技巧,一次即求出人數及縱向百分比:(詳範例 Ch07.xlsx『性別交叉運動時間-分組加上%』工作表)

馬上練習 依範例Ch07.xlsx『年齡分組交叉性別』工作表之性別與年齡資料,將 年齡分為『~35』與『36~』兩組,建立性別交叉年齡之筆數與縱向百 分比:

馬上練習 依範例Ch07.xlsx『性別交叉所得』工作表資料,將所得分為 『~40000』、『40001~50000』與『50001~』三組,建立性別交叉 所得之筆數與縱向百分比:

僅取部分資料區間分組 不過,問卷上常有答了A題,才可續答B題之情況。如:有使用手機者 才須要問其平均月費。因此,其資料就得略加整理才能進行後續之交 叉分析。 如範例Ch07.xlsx『手機平均月費』工作表內,B欄若為2,即表示未 使用手機,當然不必將其手機月費納入樞紐分析表:

停於B欄,切換到『資料』索引標籤,按『排序與篩選』群組之 『從最小 到最大排序』鈕,使該欄資料為1者,排於前面。如此,可將有手機者集中在 一起 假定,要將手機月費分為~200、201~400、401~600、601~等四組。於E2輸 入 =IF(C2<=200,1,IF(C2<=400,2,IF(C2<=600,3,4))) 並將其抄給E2:E120,即抄給有使用手機者而已:

點按A1:E120之任一儲存格,切換到『插入』索引標籤,按『表格』群 組『樞紐分析表』鈕,轉入『建立樞紐分析表』對話方塊,重選 A1:E120當來源範圍(此範圍即為有手機者之資料)

往後之操作步驟,即同於前文各節。假定,將其安排為性別交叉手機月費分 組資料,並求其欄百分比

取得樞紐分析表內容GETPIVOTDATA() GETPIVOTDATA(data_field,pivot_table,field1,item1,field2, item2,...) GETPIVOTDATA(欄位名稱,樞紐分析表,欄位1,項目1,…) 欄位名稱為用雙引號括起來的文字串或以文字型態存放之儲存格內容, 用來指明要在樞紐分析表取得何種標籤文字下所對應之資料。如:"人 數"、"%"。 樞紐分析表可以是表中的一個儲存格或是儲存格範圍,或是樞紐分析 表上方的一個標籤。 欄位1,項目1,…為1到126組成對的欄位名稱與項目名稱,用以標明要 擷取的資料,其配對組合可依任何順序排列。

茲以範例Ch07.xlsx『GETPIVOTDATA』工作表政黨傾向交叉地區別之資料 為例,若要以下表取得居住於『北區』政黨傾向『民進黨』之觀察値(人數), 可使用 =GETPIVOTDATA("人數",$L$3,"政黨傾向","民進黨","居住地區","北區") 表示要於L3這個樞紐分析表中,取得『人數』列(第6、第9、…第21)之內 容,其對應位置為:『政黨傾向』為「民進黨」、『居住地區』為「北區」。 取得此一公式甚為簡單,於U5先輸入=號再點選M6即可:

由於其欄位與項目之配對組合可依任何順序排列,故公式也可輸入成: =GETPIVOTDATA(“人數”,$L$3,“居住地區”,“北區”,“政黨傾向”,“民進黨”) 但這種公式,所有內容均為常數,不適合抄給別的儲存格。故將其改為 =GETPIVOTDATA("人數",$L$3,"政黨傾向",$T5,"居住地區",U$4) 並抄給U5:X10,即可取得各地區不同政黨傾向之觀察值:

當然,您也會認為:為何不直接於『北區』欄使用 =M6 =M9 … =M21 來取得,續再將U5:U10抄給U5:X10?(詳範例Ch07.xlsx『不使用 GETPIVOTDATA』工作表)

其理由有二: 由於列間夾有『%』資料,輸入公式=M6、=M9、=M12、……時,無法使用 複製方式進行,得逐一輸入 若樞紐分析表之篩選標準一旦改變,如以 將樞紐分析表改為不顯示『北區』之資料。我們將很容易發現,因樞紐分析表 欄數變少了,導致U5:X10所取得之觀察值均向左遞移一欄,而取得錯誤資料。 以『東區』之資料為例,其資料係原總計欄之人數:

但若改為使用GETPIVOTDATA()函數,則無論樞紐分析表如何改變,均不會 有前述之缺點發生: 『北區』欄目前顯示參照錯誤『#REF

馬上練習 針對範例Ch07.xlsx『性別交叉運動時間之觀察值』工作表內容,求其 觀察值之範圍:

卡方分配CHIDIST() CHIDIST(x,自由度) CHIDIST(x,degrees_freedom) 自由度(d.f.)將隨所使用之適合度檢定、獨立性檢定或同質性檢定而 不同。適合度檢定之自由度為組數減1(k-1)、獨立性檢定或同質性 檢定之自由度均為(列數-1)×(行數-1)即(r-1)*(c-1)。 本函數在求:於某一自由度下之卡方分配中,求x值以外之右尾的總面 積(機率)。即傳回卡方分配之右尾累計機率值(下圖之陰影部份):

卡方分配之圖形及機率值,將隨自由度不同而略有不同。以自由度為10與20 之情況下,不同卡方值所求得之單尾累計機率分別為:(詳範例Ch07 卡方分配之圖形及機率值,將隨自由度不同而略有不同。以自由度為10與20 之情況下,不同卡方值所求得之單尾累計機率分別為:(詳範例Ch07.xlsx 『CHIDIST』工作表)

卡方分配反函數CHIINV() CHIINV(累計機率,自由度) CHIINV(probability,degrees_freedom) 於已知自由度之卡方分配中,求某累計機率所對應之卡方值。此卡方 值為依單尾累計機率所求。 由於卡方分配之圖形及機率值,將隨自由度不同而略有不同。下表是 以自由度為10之情況下,所求得之結果:(詳範例Ch07.xlsx 『CHIINV』工作表)有了此函數,即可省去查卡方分配表之麻煩。 (卡方分配的臨界值詳附錄三)

馬上練習 以範例Ch07.xlsx『以CHIINV查卡方值』工作表,求自由度(d.f.) 為1~15之情況下,單尾機率為25%、10%、5%、2.5%、1%與0.5%之 卡方值:

不過,要特別注意的是:若卡方分配反函數CHIINV()內之累計機率太小,通 常於非常顯著之情況,其P值已為0值,則本函數之結果將為#NUM 不過,要特別注意的是:若卡方分配反函數CHIINV()內之累計機率太小,通 常於非常顯著之情況,其P值已為0值,則本函數之結果將為#NUM!之錯誤。 如,下表之B8內容:(詳範例Ch07.xlsx『CHIINV之缺點』工作表) 如此,將使得我們於已知P值與自由度時,想逆向求其卡方值,會發生無法求 算其卡方值之窘境,僅能取得#NUM!之錯誤(當P值已為0值時)。此時,只 好利用下文『傳統計算方式』之方式來求算卡方值。

卡方檢定CHITEST() CHITEST(觀察值範圍,期望值範圍) CHITEST(actual_range,expected_range) 本函數將依觀察值範圍與期望值範圍計算其卡方值,再傳回該值於卡方分 配之右尾機率(P)。判斷檢定結果時很簡單,只須看此P值是否小於所指 定顯著水準之α值。若是,即表示要棄卻交叉表之兩個變項間無任何關聯的 虛無假設,也就是說交叉表之兩個變項間存有顯著關聯。 觀察值範圍為交叉表之實際資料,期望值範圍則為依各欄列之機率所計算 而得之期望值。 卡方之運算公式為: 讓觀察值範圍的每一格減去期望值範圍對應位置之每一格的值,求平方, 再除以期望值範圍對應位置之每一格的值,將這些值逐一加總,即為卡方 值: 然後,計算自由度(r-1)*(c-1),r為列數、c為欄數,並查表算出此一卡方值 於卡方分配之右尾機率(P)。

傳統計算方式 茲以範例Ch07.xlsx『卡方-傳統計算』工作表之政黨傾向交叉地區別 資料為例:

說明如何進行卡方檢定,以判斷政黨支持率之高低,會不會因地區別不同而 有顯著差異,也就是要進行其獨立性檢定。其虛無假設(H0)與對立假設 (H1)為: α=0.05 其操作步驟為: 輸入標題

於U5輸入=,續點選樞紐分析表之M6,可取得 =GETPIVOTDATA(“人數”,$L$3,“政黨傾向”,“民進黨”,“居住地區”,“北區”) 將其改為 =GETPIVOTDATA("人數",$L$3,"政黨傾向",$T5,"居住地區",U$4)

續將其抄給U5:U10,再將U5:U10抄給U5:X10,取得各儲存格之觀察値 選取U5:Y11,切換到『常用』索引標籤,按『編輯』群組之『加總』鈕,取 得欄/列之加總

期望值範圍處,第一欄第一列第一欄(AB5)之期望值應為樞紐分析表之: 第一欄% × 第一列% × 總樣本數 450/1000 × 228/1000 × 1000 可簡化成 第一欄% × 第一列總計 450/1000 × 228 或 第一欄總計 × 第一列% 450 × 228/1000 以U5:Y10之觀察值範圍之內容來表示,其公式將為 =U$11*$Y5/$Y$11

續將其抄給AB5:AB10,再將AB5:AB10抄給AB5:AE10,取得各儲存格之期 望値 接著,來計算每格之 假定,要將其安排於U13:X18。U13處之公式應為: 即 =(U5-AB5)^2/AB5

將U13:X18之值加總,即卡方值32. 74: 傳統之作法,是査附錄三卡方分配的臨界值,於自由度15((4-1)

但由於有CHIDIST()函數,只須將卡方值與自由度,代入CHIDIST()函數 =CHIDIST(U20,U21) 即可求得其右尾之機率(P值,卡方獨立性檢定的顯著水準) 判斷檢定結果時很簡單,只須看此P值是否小於所指定顯著水準之α值。若是, 即表示交叉表之兩個變項間存有顯著關聯,故可省去查表之麻煩。本例,由 於其P值0.005<α=0.05,所以應棄卻政黨傾向與地區別無關之虛無假設,其 結論同於先前查表之結果

應注意下列事項 使用卡方檢定進行分析時,應注意下列事項: 卡方檢定僅適用於類別資料(名目變數,如:性別、 地區、政黨傾向、宗教信仰、是否有手機、……)。 各細格之期望次數不應少於5。通常要有80%以上的 期望次數≧5,否則會影響其卡方檢定的效果。若有 期望次數小於5時,可將其合併。如:原所得以

分成五組,於卡方檢定時,發現有太多細格之期望次數小 於5,可將其合併成: 縮減成三組,使每組人數變大後,可望消除部份期望次數 小於5之情況。 由於,各細格之期望次數不應少於5。通常要有80%以上 的期望次數≧5,否則會影響其卡方檢定的效果。故而,我 們於AE13以 =COUNTIF(AB5:AE10,"<5")/COUNT(AB5:AE10) 計算期望值<5之儲存格比例,發現僅8.3%而已,故並無 需進行任何調整:

利用CHITEST() 同樣之例子,於求得觀察值範圍(U5:X10)與其期 望值範圍(AB5:AE10)後,即可直接以 =CHITEST(U5:X10,AB5:AE10) 利用CHITEST()函數,求得其檢定結果(P值): (詳範例Ch07.xls『卡方-CHITEST』工作表)

當然,也可以透過顯著水準之P值與自由度,利用 CHIINV()函數,以 =CHIINV(X13,X15) 逆向求得其卡方值32.74:

馬上練習 針對範例Ch07.xlsx『卡方-性別交叉運動時間』工作 表之交叉表,以卡方檢定運動時間與性別是否存有顯 著之關聯(α=0.05):

馬上練習 針對範例Ch07.xlsx『卡方-手機平均月費交叉性別』 工作表之交叉表,以卡方檢定手機月費與性別是否存 有顯著之關聯:

複選題 複選題雖可多獲得幾個答案,但於分析時,卻多了很 多限制。即便是使用SPSS或SAS統計套裝軟體,複 選題也只能進行次數分配與交叉分析而已,且還無法 進行卡方檢定。若無法檢定,將會使我們寫報告時, 寫得非常沒有信心。更何況,Excel是無法直接處理 複選題的,得加上許多額外步驟。所以,應儘量避免 將問題設計成複選題! 假定,要處理

其資料列於範例Ch07.xlsx『上網原因交叉性別』工作表 ,本資料是針對107位大學生進行調查而得,常上網者有 104筆資料:

停於B欄,切換到『資料』索引標籤,按『排序與篩選』 群組之 『從最小到最大排序』鈕,將其遞增排序,使 常上網者之樣本集中在前面 切換到『插入』索引標籤,按『表格』群組『樞紐分析 表』鈕,轉入『建立樞紐分析表』對話方塊,將滑鼠移 回工作表上,重新選取A1:F105當來源範圍(此範圍即為 常上網者之資料)

往後之操作步驟即同於前文各節。由於複選題有三個答案 ,故先求性別交叉第一個上網原因之答案數(項目個數) 及其欄百分比,將其安排於H3。我們使用『答案數』而不 使用『人數』,是因為本題係複選題,其答案數會大於樣 本數,為避免混淆而不使用『人數』。獲致性別交叉第一 個上網原因之答案數及其欄百分比

由於複選題有三個答案,故回原問卷之資料的任一儲存 格,再仿前文操作步驟,於H31求性別交叉第二個上網 原因之答案數及其欄百分比

仿前文之作法,於H61求性別交叉第三個上網原因之答 案數及其欄百分比

於N5右下輸妥標題、答案、性別內容及其對應編號 雖然,前面幾個交叉表中,有答案0之情況,那只是受訪者未填答之現象,如:可複選三項,但受訪者僅填兩項原因而已。故於最後之總表,並未列出答案為0之編號,是要將0排除出去。

停於Q8,先輸入=號,續以滑鼠點選I6,取得第一個原因之第 一列第一欄內容,公式轉為 =GETPIVOTDATA(“答案數”,$H$3,“原因1”,1,“性別”,“男“) 補上+號,續以滑鼠點選I34,取得第二個原因之第一列第一欄 內容,公式轉為 =GETPIVOTDATA(”答案數”,$H$3,“原因1”,1,“性別”,“男 ”)+GETPIVOTDATA(“答案數”,$H$31,“原因2”,2,“性別”,“男“) 補上+號,續以滑鼠點選I64,取得第三個原因之第一列第一欄 內容,公式轉為 =GETPIVOTDATA("答案數",$H$3,"原因1",1,"性別","男 ")+GETPIVOTDATA("答案數",$H$31,"原因2",2,"性別","男 ")+GETPIVOTDATA("答案數",$H$61,"原因3",0,"性別","男") 按Enter鈕結束,取得三個原因表之第一列第一欄的答案數加 總 不過,應注意的的是:第一個表之第一列第一欄為原因答1之 答案數、第二個表之第一列第一欄為原因答2之答案數,第三 個表之第一列第一欄為原因答0之答案數,故其加總之數字並 非原因答1之答案數總計!

將公式改為 =GETPIVOTDATA(“答案數”,$H$3,“原因1”,$N8,“性別 ”,Q$7)+GETPIVOTDATA(“答案數”,$H$31,“原因 2”,$N8,“性別”,Q$7)+GETPIVOTDATA(“答案數 ”,$H$61,“原因3”,$N8,“性別”,Q$7) 以加總三個表中之性別為男(Q$7)、原因答1($N8) 之人數加總。但卻獲致#REF!之錯誤: 此乃第二、三個原因之交叉表上,並無填答第1個原因『 方便與家人聯絡』之故。

將公式改為先以ISERROR()判斷GETPIVOTDATA()是 否無資料?若無資料(ISERROR()成立),安排0以免 取得#REF 將公式改為先以ISERROR()判斷GETPIVOTDATA()是 否無資料?若無資料(ISERROR()成立),安排0以免 取得#REF!錯誤;反之,若有資料(ISERROR()不成立 ),則取該函數之結果: =IF(ISERR(GETPIVOTDATA("答案數",$H$3,"原因 1",$N8,"性別",Q$7)),0,GETPIVOTDATA("答案數 ",$H$3,"原因1",$N8,"性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("答案數 ",$H$31,"原因2",$N8,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$31,"原因 2",$N8,"性別",Q$7))+IF(ISERR(GETPIVOTDATA("答 案數",$H$61,"原因3",$N8,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$61,"原因 3",$N8,"性別",Q$7)) 方可取得正確之結果7:

將公式以拖曳方式向下抄給Q9,取得 =IF(ISERR(GETPIVOTDATA("答案數",$H$3,"原因 1",$N9,"性別",Q$7)),0,GETPIVOTDATA("答案數 ",$H$3,"原因1",$N9,"性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("答案數 ",$H$31,"原因2",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$31,"原因 2",$N9,"性別",Q$7))+IF(ISERR(GETPIVOTDATA("答 案數",$H$61,"原因3",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$61,"原因 3",$N9,"性別",Q$7)) 之公式

停於該格(Q9),切換到『常用』索引標籤,按『編輯 』群組『尋找及選取』鈕續選「取代(R)…」,進入『尋 找及取代』對話方塊,於『尋找目標』輸入『答案數』 ;於『取代成』輸入『%』

按【取代】鈕,可將公式內之『答案數』全改為『%』, 按【關閉】鈕結束,公式改為: =IF(ISERR(GETPIVOTDATA("%",$H$3,"原因 1",$N9,"性別",Q$7)),0,GETPIVOTDATA("%",$H$3,"原 因1",$N9,"性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("%",$H$31,"原 因2",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("%",$H$31,"原因2",$N9," 性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("%",$H$61,"原 因3",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("%",$H$61,"原因3",$N9," 性別",Q$7)) 加總出三個表中之性別為男(Q$7)、上網原因答1( $N9)之%加總:

將Q9之格式安排為百分比樣式 選取Q8:Q9,將兩個公式以拖曳方式向下抄給Q10:Q27 ,可求得男性受訪者之複選題各答案數及其百分比。

於Q8:Q27尚呈選取狀態下,以拖曳方式向右抄給R8:R27 可求得男/女受訪者之複選題各答案數及其百分比,即常 上網原因交叉性別之結果及其欄百分比

以SUM()求算Q28:R29之總計,Q28儲存格之公式為: =SUM(Q8,Q10,Q12,Q14,Q16,Q18,Q20,Q22,Q24,Q26) 抄給Q29後,將格式改為百分比格式。選取兩格,將其抄 到R28:R29:

以COUNTIF()求Q30:R30之樣本數,Q30儲存格之公式 為: =COUNTIF($F$2:$F$105,Q6) 可求得男性樣本數(Q6之內容為1),續將其抄給R30, 可求得女性樣本數:

S30儲存格之公式為: =SUM(Q30:R30) 為經常上網者之總樣本數

以SUM()求算S欄之加總,S8儲存格之公式為: =SUM(Q8:R8) S9儲存格之公式為: =S8/$S$30 將格式改為百分比格式。選取S8:S9兩格,將其抄到S29 。S29儲存格之數字代表:每一位受訪者,平均填答了幾 個上網原因(2.952),其數字為307/104。

最後,將整個表匯集出來,可發現:整體言,大學生常上 網之主要原因為:『親人提供』佔49. 0%、『追求流行』 佔46 最後,將整個表匯集出來,可發現:整體言,大學生常上 網之主要原因為:『親人提供』佔49.0%、『追求流行』 佔46.2%與『同儕間比較的心理』佔40.4%: 交叉分析後,可看出:男同學常上網之主要原因為:『親人提供』佔50.0%與『同儕間比較的心理』佔44.8%。而女同學常上網之主要原因為:『追求流行』佔56.5%與『親人提供』佔47.8%。可見常上網原因,除了係因為家中之親人已提供了上網的設備外,男生是因為與同儕比較,認為不會上網會輸給別人而去上網居多;而女生則是因為追求流行而去上網居多。

馬上練習 假定,要處理

之問卷內容,其資料安排於範例Ch07.xlsx『常用飲料交 叉性別』工作表,求常用飲料交叉性別之複選結果,並加 以解釋:

馬上練習 假定,要處理 之問卷內容,其資料安排於範例Ch07.xlsx『未購買 數位相機原因交叉性別』工作表:

求未購買數位相機原因交叉性別之複選結果,並加以解釋:

重點整理 建立樞紐分析表、百分比、篩選 變更樞紐分析表的版面配置 區間分組、僅取部分資料區間分組 取得樞紐分析表內容 GETPIVOTDATA(欄位名稱,樞紐分析表,欄位1,項目1,…) 卡方分配基本定義(補充) 卡方分配CHIDIST(卡方值x,自由度),傳回右尾的機率P CHIINV(累計機率,自由度),傳回卡方值 傳統方法計算卡方檢定 卡方檢定CHITEST(觀察值範圍,期望值範圍) P<α,即表示兩個變項間存有顯著關聯、 期望次數不應少於5 複選題處理步驟(選讀)

第七章 結束 謝謝!