統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型

Slides:



Advertisements
Similar presentations
庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
Advertisements

2007 年广州市初中信息技术 结业考试海珠区质量分析 海珠区教育发展中心 范谊 2007 年 9 月 8 日.
河北衡水中学 康新江 高效课堂与激情教育 河北衡水中学 康新江
心理与教育测量学 贵州师范大学教育科学学院 赵守盈.
中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
糖尿病健康教育 广水市健康教育所 (2).
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
統計調查規劃設計 ~如何統計分析資料?~ 輔仁大學統計資訊系 謝邦昌 教授.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
1 Chapter 統計學緒論.
问卷调查的规范与技术 问卷调查的规范与技术.
上海体育职业学院 祁社生 一、重视体育科研在提高竞技运动训练水平中的意义和作用
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
健康一二一 宜兴市疾病预防控制中心 周 茜
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
How to Use SPSS in Biomedical Data analysis
Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法
生物醫學統計學.
长沙市国民体质现状 与发展对策研究 肖渐光 谌晓安.
104學年度臺南區免試入學作業國中端說明會 臺南市政府教育局 104學年度臺南區高級中等學校免試入學委員會 日期:104年1月9日(五)
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
                                         減肥.
大 綱 重大變革事項 甄選員額 甄選資格 甄選期程 軍官基礎教育與服役.
第 1 章 資料與統計.
生物科 陳鳳娟老師.
第7章 量表的建立—補充 4.1 基本觀念 4.2 測量程序 4.3 測量尺度 4.4 良好測量工具的特性 4.5 信度測量
小儿营养不良 第四篇第二章第二节小儿营养不良.
報告人:財團法人台灣癌症基金會執行長 賴基銘 醫師
2016年莱芜市乡村医生在岗培训 启动会.
单元 SD 5 菜鸟学飞 附件二 想学飞的职场菜鸟.
第一章 统计学及其基本概念 南京财经大学统计学系.
100學年度高職校務評鑑簡報 報告人:校長 江銘鉦 日期:101年4月27日
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
健康減重飲食 高雄國軍總醫院 營養師余惠婷.
金門縣多年國小101學年度 推動健康促進學校成果簡報
Dr. Hamda Qotba, B.Med.Sc, M.D, ABCM 翻译:acred(DXY)
92-90數學課程綱要比較 -- 不含數與計算 台北市立師範學院 數學資訊教育系副教授 李源順.
如何健康減重 四維國小營養教育 富鑫菓菜有限公司 楊訟芬 營養師.
Descriptive statistics
传媒学院2013年度团委工作 总结分析报告
初級統計學 陳信如.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 八 章 迴歸分析假設條件 之檢定及補救措施 2018/11/28.
敘述統計-資料的特性 Properties of Variable
第一章 敘述統計學.
第八章 科研资料的整理与分析.
第 4 章 分散量數.
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
问卷设计及数据分析初步 柯政
因果關係理論的建立 結構方程模型(Structural equation modeling,SEM)
EXCEL+ORIGN+SPSS的描述统计
Chapter 1 統計學緒論. Chapter 1 統計學緒論 Study Report 講述一個神奇而美麗的統計 很多人或許常常在問:「What is Statistics」-統計是甚麼? 統計是製造可信賴的之資料,分析資料的真正意義。 有一列火車上有一位統計學家,一位物理學家和一位數學.
統計學簡介 許明宗.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
社会科学统计软件及应用 马秀麟 2016年5月.
單元2 範例介紹、資料型態與資料讀取 羅琪老師
第十章 態度量表(問卷設計).
生物统计学 Biostatistics 第一章 统计数据的收集与整理
軍校與民間大學之比較 軍校 民間大學 服裝食宿學雜費 由國家供給 除公費生外餘須自費 零用金 每月14,190元 父母供應或打工賺取 畢業
第一章 概說.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
組員: 鄭祖惠(2) 梁佩盈(6) 陳興進(25) 盧業承(26) 林國棟(29)
97學年度第二學期水保系碩專班專題報告 農生再生試辦區之分析探討 報告人:簡榮杰.
地理資料 包含兩部分 地理位置 表明這個地理資料的位置在何處。地理資料為空間資料的一種,因此必須對空間中的位置加以標定 屬性
SAS 統計程序實作 PROC MEANS (一個母體)
Presentation transcript:

統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型 量測得到的資料可分為 : i .質性資料,ii. 數量資料,因資料的屬性不同,選擇的分析方法不同。 i 類目資料 (Categorical Data) -- 文字,代號 或分類資料 (SAS: 字串, SPSS: 名義 nominal) ii 數量資料 ( Quantitative Data) -- 有序的,或量測的,又分為 離散型 Discrete type : 次數、排名、測量時間點 連續型 Continuous type : 如:血壓、測量值、時間、指數

nominal , ordinal, interval, ratio 若以測量尺度分類:資料分類為 nominal , ordinal, interval, ratio 注意:Categorical data 可能是 nominal 尺度,或是 ordinal 尺度, 若是 ordinal 尺度,則可以 1, 2, 3 …代替之。連續型資料歸屬於 interval 尺度。不同類型資料使用的統計值不同,解釋上也不同。 二、實作資料 原始測值 – 血壓、體重、等 比例值 -- 血清中鉻濃度 轉換資料 – 指數,如:BMI(經驗式) 多變量 --老化: (代謝功能,免疫功能,抗氣化效力)

三、資料的統計值 ( 質性資料不考慮下列統計值 ) 中心位置 -- 平均數(mean),中位數(median) 參考位置 – quantile, percentile, 四分位數(quartile) ,五分位數(quintile) 變化程度 -- 標準差(SD) ,變異係數 (CV) ( CV= 標準差 / 平均數 ) 其他 -- 偏態係數(skewness),峰態係數(kurtosis)

資料中心位置的指標 變化程度的指標 資料對稱性的指標 資料常態性的指標

質性資料以長條圖或圓餅圖來表現它的統計分佈 四、資料分佈圖 質性資料以長條圖或圓餅圖來表現它的統計分佈 一般數量資料的統計分佈類型有 1.對稱型:常態型 長尾型 短尾型 2.偏斜型:右偏型 或 左偏型 1、直方圖 (histogram) 表現資料位置,變化度 ,分佈型態,離群個案

2、盒鬚圖 (box plot) 以最小值,25%,50% ,75%,最大值表現資料位置,分散度,分佈型態,離群個案。常用於數組資料的比較。

3、一般論文上的統計描述

貳、常態分佈在統計上的角色 一、特性: 資料標準化後為標準常態分佈。 偏態係數 = 0,峰態係數 = 0。 資料的分佈,可由均值及標準差來推估 若一組資料接近常態分配,可推估約 二、重要性: 自然界中許多資料呈現常態分佈。 大樣本之平均數接近常態分佈(中央極限定理) 基本統計方法通常假設資料來自於常態母體,故需檢測資料的常態性,以確保分析的結果是可信的。

三、與常態相關之分佈 理論上,資料是常態分佈,則樣本變異數屬於 χ2 分配。 由此推導出 t-分佈與 F-分佈,它們是統計推論上常用之分佈。 用於平均數檢定或 兩組資料比較 (自由度與樣本數有關,會影影響均值的分布) 用於兩組變異數比較 或 多組均值比較的變異數分析

四、如何判斷資料是否屬於常態資料? 偏態係數和峰態係數皆接近 0,則資料可能取自常態母體。 常態機率圖 : 若圖形接近直線, 則資料可能取自常態母體。 Wilk-Shapiro test 或 Komogorov-Smirov test : H0 : 資料取自常態母體, p-值大小表示母體資料為常態之可信度。

多數測量值呈現常態分佈,大樣本情況下可忽略常態假設的要求 若有離群個案,會使資料偏離常態 利用數學式可將資料轉換成接近常態分佈 如: 五、 多數測量值呈現常態分佈,大樣本情況下可忽略常態假設的要求 若有離群個案,會使資料偏離常態 利用數學式可將資料轉換成接近常態分佈 如: 對數轉換後分佈 原資料分佈 注意:尋找一合適的轉換式,需要依據研究者之經驗

參、基本統計推論 一、抽樣誤差 實際母體 估計之母體 統計推論必產生差異,稱為抽樣誤差; 抽樣誤差的大小與樣本數有關。 樣 本 例: 抽樣25位受感染者測得其白血球平均值 = 4767,標準差SD= 3200,估計誤差 SEM=640

二、估計 點估計 分類資料:以樣本比例估計母體比例 (如 抽煙比例) 數量資料:以樣本平均數估計母體平均數、 以樣本標準差估計標準差 估計之精確度: 說明:Mean ± SD 呈現資料的變化程度 Mean ± SEM 呈現以均值估計的準確度

1. Weight gain = 20.06 ± 2.25 (mean ± SEM) n=5 以 95% 的信心水準估計 2.25) 區間估計 以一區間估計參數可能落入的範圍。 例: 1. Weight gain = 20.06 ± 2.25 (mean ± SEM) n=5 以 95% 的信心水準估計 2.25) 2. 在 95% 的信心水準下,抽樣錯誤差為正負3.1個百分點; 資料支持的比例 = 24%,則估計支持率在 20.9% 到 27.1% 之間。 註:t 0.025(4) = 2.785,可用excel tinv 求得。

檢定: 對某一研究主題作成假說(hypothesis),根據資料來判斷是否接受此假說。 三、檢定 檢定: 對某一研究主題作成假說(hypothesis),根據資料來判斷是否接受此假說。 p-值 資料顯示 H0 為真的可能性 p-值 < α,結論為 H1,即研究主題顯著 (significant)。 p-值 大時,結論為資料不足以証實研究的主題; 即研究主題不顯著 (non-significant)。 檢定法 選擇適當的方法,利用統計軟體得到 p-值, 做出結論。

骰子60次,得到50次的6點,這是機運或是假骰子? 甲在10次考試中,有8次成績都比乙好,是機運或是甲的程度比乙好? 觀念: 骰子60次,得到50次的6點,這是機運或是假骰子? 甲在10次考試中,有8次成績都比乙好,是機運或是甲的程度比乙好? 先設 甲=乙 成立 根據資料算出 p-值 = 0.001 若甲=乙,只有0.1%的機率得到此結果。 判斷甲顯然不等於乙。p-值 小於 0.05 以α=0.05水準檢定,甲和乙的程度差異是顯著的

檢定的顯著p-值 不顯著的情況 顯著的情況

四、兩變數之相關性 兩變數相關強度由相關係數,ρXY,量測,-1 ≦ ρ ≦ 1。 樣本相關係數: 上式稱為 Pearson 相關係數,用來估計相關強度;若 r 不等於 0,並不表示ρ不等於 0。檢定法可讓我們判斷二變數是否相關。

檢定: H0: ρ =0 (無關) vs. H1: ρ ≠0 (相關) 用 t-test, Q:相關係數多大時,才能結論二變數是顯著相關? 其 r 的絕對值必須大於下列表值,則二變數是顯著相關的;由此知當樣本小時,資料不容易達到顯著相關。 n 10 15 20 25 30 40 50 100 α=0.05 .632 .514 .444 .396 .361 .312 .279 .196 α=0.01 .585 .411 .315 .255 .214 .162 .130 .066