統計調查規劃設計 ~如何統計分析資料?~ 輔仁大學統計資訊系 謝邦昌 教授.

Slides:



Advertisements
Similar presentations
实用农业科技写作 王鹏文. 第一章 导论 第一节 农业科技写作概述 一 、 农业科技写作概念和分类: 科技文献类、科技应用类、 科技普及类、科技新闻类 二、 农业科技写作的意义和重要性: 科技工作的重要组成部分、科学研究的手段、 科技成果的反映和标志、科技交流的工具 三、 农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、
Advertisements

新课程引领 实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一 轮课程改革实验以来,在市教研室的正 确领导下,我县初中信息技术课改工作 稳步推进。三年来,取得了一些成果, 也有不少体会。现将三年来的信息技术 课改工作总结如下。
河南省基础教育资源网 邓伟鹏 二〇一二年七月 内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.
桐乡市地方税务局 2013 年度社会保险费汇算清缴有 关政策及事项说明. 一、政策规定 根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管 理办法》(市政府令第 42 号)、《 关于完善社会保险费征缴管理有关问 题的通知》(桐政办发 [2012]152 号)及《关于完善社会保险费征缴管理.
心理与教育测量学 贵州师范大学教育科学学院 赵守盈.
大安區簡介 人口:315,628人 面積:約 平方公里 本區位於台北市中央地帶:
《可能性大小》的教学比较 一、介绍两个版本的教材 · 北师大版(七上) 第7.1节 一定摸到地球吗 摸球游戏——体验事件发生的可能是有大小的
NO.005 職涯 報 實習 徵才 攻讀 國立嘉義大學 學生事務處學生職涯發展中心.
國中教育會考 十二年國教—免試入學 及 意見整理.
全面推进基础教育综合改革 ——在基础教育综合改革推进暨“1751”工程总结会上的讲话
調查資料分析前之步驟 國立政治大學選舉研究中心 蔡佳泓副研究員.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
1 Chapter 統計學緒論.
严格标准 规范程序 认真做好党员发展工作.
薪資申報系統操作說明.
商学院 旅游管理专业介绍.
 历史以人类的活动为特定的对象,它思接万载,视通万里,千恣百态,令人销魂,因此它比其他学科更能激发人们的想像力。    
採購規範運用實務(含履約管理) 主講人:新北市政府採購處 勞務採購科 陳佑民.
第 3 章 資料分類與蒐集 1.進行研究過程中最重要的步驟 2.資料收集與實驗設計具有關連性.
爸爸的2000元 一個孩子省思的故事.
《数学》(华师大.八年级 下册) 第二十一章数据的整理与初步处理 扇形统计图的制作.
第一节: 食物中的营养物质.
由“林则徐销烟” 说开来…… ——学校禁毒主题班会.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (学院、部门适用)
淺談如何準備大學面試 國立清華大學 核子工程與科學研究所 梁正宏 竹北高中.
閱 讀 與 寫 作 能 力 的 提 升 桃園縣國教輔導員 陳筱玲.
消防安全知识 昆明市公安消防支队 盘龙区大队.
『臺北市營建剩餘資源管理系統』 教育訓練說明 臺北市政府 報告人 王宏正
市場調查的問卷設計與編製流程(產品、服務等滿意度調查) 共2週
“三项制度+一个平台”构建 省级高校教学质量监控体系
学习消防 远离火灾 ——峨眉二小三(3)班主题班会 峨眉二小 杨建华.
瓯海职专财经专业组简介.
老年性皮肤瘙痒的防治.
国有资产清查 数据填报操作规范 2016年3月25日.
第 1 章 資料與統計.
室内设计概论 艺 术 设 计 专 业 主讲:李博慧 为生活创造一个理想、舒适的内部环境
3 室内空间界面的设计 本章提要 本章主要介绍室内空间界面的设计,主要包括界面的要求、功能、选材等方面,以及界面处理的原则和要点等方面的知识。在学习过程中,要注意区分空间界面的共性特点和个性要求、室内界面设计的原则和要点,以指导今后的具体设计。
上海文会会计师事务所有限公司 中国注册会计师 童幸义
你不得不知的几件事 2、图书《10天行测通关特训》 3、网络课程 《网校9元课程系列》《考前强化夜校班》 4、地面课程 《10天10晚名师密授营》《考前预测集训营》
关于成绩的数理统计的探讨 望您多多指教!多谢!!.
仓储企业岗位人员招聘 第一组 组员 :陈娇娇 祝婷婷 丁元莉 袁珮 王慧.
初三历史复习课 八上第一单元 侵略与反抗 草桥实验中学 朱萍.
人口与计划生育 统计分析 昌吉市计划生育委员会 二○○六年三月.
新北市政府所屬各機關辦理採購規範 主講人:新北市政府採購處 李佳航、黃建中、陳佑民.
平安是福 注意安全 珍爱生命 莫让父母的期盼转眼成空.
力行“十戒” 预防犯罪 青少年法制教育辅导材料
2014年深圳市学生人身意外伤害保险投保工作介绍 中国人民财产保险股份有限公司深圳市分公司
中国最安逸的7座小城:找个地方,过慢生活 图文:网络 制作:涛声
破除迷思 落實通報─校園性騷擾、性侵害處理流程
東北林業大學第三屆海峽兩岸大學生 冰雪之情冬令營
房地产业营改增税制变革 知 识 讲 座 二0一五年四月二十日.
初級統計學 陳信如.
敘述統計-資料的特性 Properties of Variable
第八章 科研资料的整理与分析.
第二版 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
负数.
问卷设计及数据分析初步 柯政
办学条件核查 评估秘书组 电力职业技术学院 山西机电职业技术学院 2014年7月9日.
科 展 說 明.
第二节 山地的形成.
統計學簡介 許明宗.
怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 怎样报销劳务性费用? ——暨薪酬发放申报系统介绍 (项目经费适用)
成本会计学.
舊生升級編班與新生管理操作說明 全誼資訊股份有限公司 中華民國106年06月05日.
單元2 範例介紹、資料型態與資料讀取 羅琪老師
第十章 態度量表(問卷設計).
第4章 Excel电子表格 Excel操作必须掌握的知识点: 掌握建立、打开、保存和编辑文档的基本操作 ;
新课程理念下如何进行课堂教学 刘志超 2014年2月25日.
地理資料 包含兩部分 地理位置 表明這個地理資料的位置在何處。地理資料為空間資料的一種,因此必須對空間中的位置加以標定 屬性
6 分析資料-以統計測量數呈現.
Presentation transcript:

統計調查規劃設計 ~如何統計分析資料?~ 輔仁大學統計資訊系 謝邦昌 教授

Data Preparing 整理、編輯、分類 編碼(譯碼) 問卷先期檢查 鍵入(KEY-IN) 檢誤(Check Error)

資料整理、編輯與分類 在民調資料蒐集後的首要工作就是要對資料做整理、編輯、分類。 編輯的目的在剔除原始資料的謬誤。 記載分類號碼的目的在於將資料分類,使統計工作能順利且易於進行。

資料編碼 所謂「編碼」即將受訪者回答之問卷答項量化成電腦可以接受的語言。 封閉式問項  1  2

開放式問項編碼 研究人員在進行編碼之前,必須將全部的答案翻閱一次,先歸納出幾個顯而易見的大類別,然後再把每位受訪者的答案一一歸入各類別。 分類的標準完全取決於研究人員的專業素養與主觀判斷,但應注意必須便利於後續的統計分析工作。

通常一份問卷會有一份專屬的『編碼表』,或稱做『譯碼簿』。

問卷先期檢查 在統計分析工作開始前對資料做『先期檢查』。 (1) 樣本是否符合 (2) 問卷記錄的可解性 (3) 問卷記錄的完整性

資料鍵入 將問卷記載答案輸入電腦中。 目前一般使用者所會使用到的資料建檔(或KEY-IN)工具,依類型來區分,可大致分成:文書處理軟體、試算表軟體、統計分析軟體、資料庫軟體。不同類型的軟體,其所提供的功能也會有所差別。

文書處理軟體 所有能處理純文字資料的軟體,如PEII、漢書、記事本、UltraEdit等。 這些軟體的特色是系統資源需求不大,價格便宜(記事本為WINDOWS內附屬),操作上也相當簡單。

試算表軟體 資料顯示畫面是以工作表(Sheet)方示表現,最常使用的軟體有:LOTUS 1-2-3、dBASE、EXCEL等。 試算表軟體的特色,在於其欄位的資料可以做運算,且欄位資料分隔明顯。 EXCEL的功能,因為外加巨集(MACRO)及VBA的功能,使EXCEL也可做一些基本的檢誤及統計分析的工作。

統計分析軟體 以處理統計分析為主的軟體,常用軟體有SAS、SPSS、STATISTICA、MINITAB、S-PLUS等。 有的是以文字編輯軟體的畫面呈現,有的則是以試算表的畫面呈現。

資料庫軟體 資料庫軟體顧名思義,就是專門用來儲存資料的工具軟體。最常接觸到的軟體有ACCESS、MS-SQL、IBM-DB2、SyBase等等。 一般在使用上並不會直接將資料鍵入資料庫內,而是會利用編寫好的程式,將鍵入資料轉入資料庫內。

資料檢誤 資料在建檔完成後,需先對資料做檢誤的動作。 把不合常態、不符合問卷前後一致性、或問項回答間相互矛盾的資料,做資料確認或更正的動作,以確保爾後資料分析的品質。 規則性檢查:答案出現選項之外的數字。 常態性檢查:例如年齡超過200歲。 邏輯性檢查:例如受訪者為男性,卻回答生育第一 胎的年齡。

調查資料的統計預處理 缺失資料的處理 1.用一個樣本統計量的值去代替缺失值 2.用一個統計模型計算出來的值去代替缺失 值 2.用一個統計模型計算出來的值去代替缺失 值 3.將有缺失值的個案整個刪除 4.將有缺失值的個案保留,僅在相映的分析 中做必要的排除

調查資料的統計預處理 加權處理 主要目的:使樣本更具代表性,或為了強調某些被訪者群體的重要性。

調查資料的統計預處理 原始資料的轉換(重新分類、重新編碼) 需要將資料分成更有意義的類別 需要將資料合併成更少的幾個大類 重新構成的新類別必須滿足 所有的情況都已包括在新的類別之中 各個類別之間沒有交叉或重疊 類別間的差異大於類別內的差異

調查資料的統計預處理 變數的轉換(重新定義變數、修改變數) 、 『流行音樂參與度得分』新變數=『每月上KTV次數』+『每月購買CD數』 Dummy Variable Standardize 為了使不同單位的變數具有可比性。

統計作業上需注意的幾項原則 1. 應事先計畫好每一大分類的統計順序,如 此可避免許多混亂發生的機會。 2. 基本總數要在作業一開始時就計算。 1. 應事先計畫好每一大分類的統計順序,如 此可避免許多混亂發生的機會。 2. 基本總數要在作業一開始時就計算。 3. 應設一專人負責統籌所有的計算作業。 4. 基本總數和統計數目要不斷地反覆對照。 5. 電腦要標準化。 6. 所有格式都要有一個明確的標題。

統計作業上需注意的幾項原則 7. 所有表格都要加上號碼並排序。 8. 表格上要有詳細的分類項目。 9. 分類時必須注意不要重複。 7. 所有表格都要加上號碼並排序。 8. 表格上要有詳細的分類項目。 9. 分類時必須注意不要重複。 10. 表格記錄必須完整。 11. 計算表和統計表的分類越細越好,並盡量 配合圖形。 12. 各種資料的特性和相異性要盡量淺顯地表 現在表格上,使之一目了然。

各種衡量尺度 量化的處理工具便稱為衡量的尺度,又稱量表(Scale)。 問卷衡量尺度的設計是評估報告是否深入的關鍵。 不同的量表應用不同的統計分析,準確性才會提高。 考量的依據: 1.研究目的與問題深入的程度 2.事後資料整理時之便利性 3.各種可能選項的周延性與互斥性需兼顧 4.統計的方法

一、類別量表(nominal scale) 此種量表是根據被調查對象的性質而分類,如根據消費者答案可分為「喜歡」與「不喜歡」或「是」與「否」兩類。 每類答案的數字只作為分類之用,如果將這些答案數字(1,2,3)做運算,根本沒有意義,因為這些數字在此僅屬名義而已,真正目的是在分類。 二、順序量表(ordinal scale) 較類別量表多一特性,可以表示各類別之間的順序關係。 如要求消費者根據其心中偏好,將五種飲料品牌依最喜歡到最不喜歡的順序排列,最喜歡給5分、最不喜歡給1分,這就是一種順序量表。 不過代表順序的數字還是不能用來做運算,只能看出高低次序,卻無法確定順序之間的差異大小,例如若已知A>B>C>D>E,但並不知道A與B的差距,或C與D的差距,所以也無法得知兩種差距是否相等。

三、差距量表(interval scale) 較順序量表再推進一步,不單能表示順序關係,尚能測量各順序之間的距離,可確定地指出5分與4分之差距等於4分與3分的差距。 差距量表的分數可用來做加減乘除的運算,此為其之一大優點,但是不能說明6分為3分的兩倍,因為差距量表並沒有一個真正零點(真零)。 四、比率量表(ratio scale) 比率量表除了具有差距量表的全部特色外,再加上「真零」這個特性。 例如身高、年齡、體重等變數的測量都是用比率量表,故可說體重180磅的人比90磅的人重兩倍。 不過在態度測量方面,運用比率量表顯然有困難,消費者給一種飲料100分,另一種給50分,但卻不表示喜歡程度有兩倍的差距。因為態度測量本質上為一順序概念,顯然不宜用比率或差距量表測量。

適用於各類量表的統計分析方法列如下表:

跳出思路的陷阱 統計是取得數字後,加以整理分析的工作。

? 騙人的平均數 老謝應徵工作 公司規模:老闆、經理2位、組長3位、職員5位。 老闆:公司平均月薪6萬元,受訓期間1萬五千元,很快會加薪。 做 不做

中間數:4萬 平均數:6萬 眾數:2萬

某次統計學考試,甲班平均分數為80分,標準差為20,乙班平均分數為75分,標準差為5,哪一班成績較優?

根據統計顯示,多數車禍發生在車子行駛於一般車速的時候,只有少數車禍發生在車速超過時速150公里。 開快車較安全。 研究顯示,有個城市死於心臟病的人數與口香糖的消費量同時遽增。 嚼口香糖導致心臟病。 多數人都以一般車速開車,自然多數車禍發生於一般車速。 這兩類數字的增加是因為人口快速成長的結果。

現在我要寄一封文件給一位我不認識的人,我先寄給最有可能認識目標者的人,再請他轉寄,如此轉寄到目標者手中,請問中間經過人數? 現場有兩人是同月同日生的機率為? 平均為5人 23人機率略高於1/2, 40人機率達到90%以上。

解讀民意調查 A候選人支持度31.2% B候選人支持度28.5% C候選人支持度24.9% 成功訪問1,068位受訪者,在95%的信心水準下,抽樣誤差為正負3%。

問題與討論