STATISTICA統計軟體的應用 第二講:廻歸與ANOVA

Slides:



Advertisements
Similar presentations
1 SPSS 軟體與變異數分析 南台科技大學企管系呂金河. 2 變異數分析 §1 變異數分析的基本概念 目的:變異數分析的作用在於分析各種變異的來源, 並進而加以比較,以瞭解不同的實驗變數所造成的 結果是否有顯著的差異,它的虛無和對立假設如下 : 在進行 ANOVA 及 MANOVA 變異數分析時,必.
Advertisements

第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
南台科技大學 萬金生教授 九十八年六月十二日
張偉豪 三星統計服務有限公司 執行長 Amos 亞洲一哥
多元统计分析 何晓群 中国人民大学出版社 2017/3/4 中国人民大学六西格玛质量管理研究中心.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
前言 MINITAB 是为质量改善、教育和研究应用领域提供统计软件和服务的先导。是一个很好的质量管理和质量设计的工具软件,更是持续质量改进的良好工具软件。 MINITAB 统计软件为质量改善和概率应用提供准确和易用的工具。MINITAB 被许多世界一流的公司所采用,包括通用电器、福特汽车、通用汽车、3M、霍尼韦尔、LG、东芝、诺基亚、以及.
How to Use SPSS in Biomedical Data analysis
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
DOE & EXCEL, SPSS application
變異數分析 (Analysis-of-Variance簡稱ANOVA)
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
多元迴歸 Multiple Regression
單元九、spss與平均數差異檢定 沈瑞棋.
回归分析 线性回归 Logistic回归 对数线性模型
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
SPSS軟體與迴歸分析 南台科技大學企管系 呂金河.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
Analysis of Variance 變異數分析
第 14 章 複迴歸與相關分析.
實 驗 研 究 法 多因子實驗設計 指導老師:黃萬居教授 學生:陳志鴻 m
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
平均值檢定 4.1 檢定之原理 4.2 各種平均值之檢定 商管研究資料分析SPSS的應用 Chapter 4 平均值檢定.
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
关于虚拟变量回归模型 教学目的:了解虚拟变量的含义及使用,能够应用软件进行实例模拟。 教学内容: 虚拟变量的基本含义及使用
第七章 SPSS的非参数检验.
Created on Jun. 9th, 2009 By Dr. Wei-Mann Lee
量化研究與統計分析 比較平均數 Test 謝寶煖 台灣大學圖書資訊學系 2006年4月1日.
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
第 八 章 迴歸分析假設條件 之檢定及補救措施 2018/11/28.
用于计算智能研究 和人类主观测试的 统计检验 Hideyuki TAKAGI 日本 九州大学
第 13 章 實驗設計與變異數分析.
统计软件应用 7 主讲人 陶育纯 SPSS统计分析 统计软件应用 7 主讲人 陶育纯 教案.
Chapter 14 Simple Linear Regression
ANOVA簡介 許晉誠
Test for difference among the means: t Test
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
4 統計分析程序的選擇.
十、變方分析 (Analysis of Variance) (Chapter 10)
自我介紹  黃郁哲 (Jeff) (阿哲)  高雄人  求學經歷 逢甲大學運管系畢業 交通大學運管系碩一 交通大學逕博生  興趣 吃遍美食、看歷史劇  許巧鶯老師研究室(許lab)  未來研究方向 海運業產業結構動態變化 各產業結構貨運量預測.
線性相關與直線迴歸 基本概念 線性相關:兩個連續變項的共變關係,且有線性關係。所謂 的線性關係乃指兩個變項的關係可以被一條最具
論文計畫書 國軍人員對廢軍品管理現況之研究─以空軍 後勤單位為例 指導教授:胡子陵博士 研究生:劉俊德.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程.
大學校院教職員對休閒運動參與動機與行為之研究-以淡水地區為例
生物統計 1 課程簡介 (Introduction)
指導老師:蘇明俊 組員: 陳柔安 潘依蓮 張壹凱
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 4 主讲人 陶育纯 医学统计学方法 4 主讲人 陶育纯 流行病与卫生统计学教研室
Design and Analysis of Experiments Final Report of Project
篇三 因果性研究 在教育的科學研究裡面,由於教育現象變項太多,因果性的研究較為困難,也頗為複雜。其研究的取向有兩種:一種是依循邏輯實證論的觀點,提出研究假設,預測一個或若干自變項,或特定的特質或事件,x,決定另一變項或事件,y。 另一種取向係基於社會現象的複雜性為著眼點,假定一種事件結局來自多變項的考量,強調造成某一行為或效果可能有多項自變項,例如學生的學業的成績是來自多種因素作用的結果,於是蒐集相關的資料,分析其間的相關,並利用複迴歸及徑路分析來探討徑路過程。
研究所生物統計課程整合說明 課程規劃及修課建議 楊奕馨 高雄醫學大學 藥學系 研究所生統課程授課教師
自我介紹 羅啟倫 學歷: 經歷: 東華大學 電機工程系
Which independent variables is more important?
第八章 均值比较与检验 2019/5/10.
第7章 基本统计分析 2019/5/14.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
Logistic回归 Logistic regression 研究生《医学统计学》.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
第八章 方差分析(analysis of variance)
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
Chapter 1 函數 1.1 函數的定義 1.2 基本函數 1.3 函數的運算 1.4 函數的圖形.
Part 3 初等統計與理論.
97學年度第二學期水保系碩專班專題報告 農生再生試辦區之分析探討 報告人:簡榮杰.
实习二 方差分析 流行病与卫生统计学系
Presentation transcript:

STATISTICA統計軟體的應用 第二講:廻歸與ANOVA 南台科技大學企管系 呂金河

六、相關係數 七、迴歸分析

六、相關係數 例如 1. 經理想了解產品價格與銷售量是否有相關? 2. 教育學者想了解 IQ成績與教學成績是否有相關? 1. 經理想了解產品價格與銷售量是否有相關? 2. 教育學者想了解 IQ成績與教學成績是否有相關? 3.醫生想了解人出生時的體重與壽命是否有相關? 4. 房地產公司想了解房價與物價是否有相關?

連續變數間的相關係數常用Pearson 相關係數描述,次序型變數的相關係數常用Spearman秩相關係數描述, Pearson r= -1≦r≦1,r=1時,x 與y成一斜率為正的直線,稱為完全正相關; r= -1時,x 與y成一斜率為負的直線,稱為完全負相關。 r > 0 表 x 值增加時,y值有增加的傾向; r < 0 表 x值增加時,y 值有減少的傾向。 r = 0 表x 與y 無線性相關,x 與y可能有U形曲線相關

變數間有〝相關〞不一定有〝因果關係〞 STATISTICA操作: 點選 統計(Statistics) 基本統計/表格 (Basic Statistics/Tables) 相關係數矩陣(Correlation matrices) 確定(OK) 單一變數表列(One variable list)  選取要分析的變數  按確定(OK) 按選項欄(Option),勾選包含r,p-levels與樣本數(Display r, p-levels and N’s) (做檢定) 按摘要(Summary)

七、迴歸分析 目的:找出一個線性方程式,用來說明一組預測變數( Xi )與效標變數( Y )的關係。目的在探求Y與Xi的關係式

§7.1迴歸分析的步驟 1.選定反應變數(Y)與解釋變數 ,(複)線性迴歸模式為 且互相獨立 其中,α與β為迴歸母數(i=1, 2, ……, n),ε為誤差項。 在迴歸分析中,如果預測變數(Xi)只有一個,則稱之為簡單迴歸分析。如果預測變數有二個以上,則稱為多元迴歸或複迴歸分析。

資料格式

選擇重要自變數 (用逐步迴歸法) 估計 的值,並對每一個βi 檢定βi=0 否 (t檢定) (各別邊際檢定) 在ANOVA表上,檢定 否 (總檢定,F檢定) ,以瞭解整體關係是否達到顯著水準 用調整後判定係數 (>0.18) 判定模式合格否 (配適度) 用判定係數 判定總變異被迴歸解釋的百分比,以瞭解這個方程式的預測能力如何。

殘差分析,檢查 是否滿足 (1)常態性 (用Wilk-Shapiro W檢定或常態機率圖), (2)變異數恆常性(用ei對Xk的殘差圖,或ei2對每一Xk作迴歸,看β1 =0否), (3)獨立性(用Durbin-Watson檢定,D-W值介在1.5至2.5表示無自我相關)等三個假設條件 若殘差分析證明模式不合適,可能需做變數轉換,去除離群值,增減變數等以修正模式 模式解釋

迴歸分析STATISTICA操作法 (1)一般多元迴歸 點選 統計(Statistics) 多元迴歸(Multiple Regression)  按在快速欄(Quick)的變數(Variables) 選取反應變數(Dependent)與獨立變數(Independent)  確定(OK)確定(OK) 按快速欄(Quick)的摘要(Summary): 迴歸分析結果按進階欄(Advanced)的變異數分析(ANOVA) 按殘差/假設/預測欄(Residual/assumptions/prediction)在預測值欄(Predict values),勾選計算信賴區間(Compute confidence limits)或計算預測區間(Compute prediction limits),按反應變數之的預測值(Predict dependent variable)輸入自變數的值 按確定(OK) 按殘差/假設/預測欄(Residual/assumptions/prediction) 按執行殘差分析(Perform residual analysis)按摘要(Summary)在進階欄(Advanced)按Durbin-Watson統計量,在散佈圖欄(Scatterplots)按各式殘差圖,在機率圖(Probability plots)欄按殘差之常態機率圖

(2)逐步迴歸 點選 統計(Statistics) 多元迴歸(Multiple Regression)  按在進階欄(Advanced)的變數(Variables) 選取反應變數(Dependent)與獨立變數(Independent)  確定(OK)勾選進階選項(Advanced options(stepwise or ridge regression))確定(OK) 在快速欄(Quick)的方法(Method)選向前逐步(Forward stepwise)或向後逐步(Backward stepwise) 確定(OK)在快速欄(Quick)按摘要(Summary): 迴歸分析結果按進階欄(Advanced)的變異數分析(ANOVA) 按殘差/假設/預測欄(Residual/assumptions/prediction)在預測值欄(Predict values),勾選計算信賴區間(Compute confidence limits)或計算預測區間(Compute prediction limits),按反應變數之的預測值(Predict dependent variable)輸入自變數的值 按確定(OK) 按殘差/假設/預測欄(Residual/assumptions/prediction)按執行殘差分析(Perform residual analysis)按摘要(Summary) 在進階欄(Advanced)按Durbin-Watson統計量,在散佈圖欄(Scatterplots)按各式殘差圖,在機率圖(Probability plots)欄按殘差之常態機率圖

八、變異數分析 §8.1 變異數分析的基本概念 目的:變異數分析的作用在於分析各種變異的來源,並進而加以比較,以瞭解不同的實驗變數所造成的結果是否有顯著的差異,它的虛無和對立假設如下: 在進行ANOVA 及 MANOVA變異數分析時,必須確定或假定以下幾項前提 1. 所有的樣本都是隨機抽選而得,而且彼此獨立。 2.各母體呈常態分配。 3.各母體的變異數σ2都相等。 只有在上述三個條件滿足下,才可利用ANOVA進行檢定。

下面介紹實驗設計的幾個重要名詞: (1)因子(或要因或因素):影響品質特性的可能因子(Factor),因子需以分類資料呈現。 (2)水準:每個因子在實驗時設定的可能分類稱為水準(Level),在一實驗中各個因子的水準數可能不同,如因子A有2個水準,因子B有3 個水準,因子D有3個水準。 (3)處理:各種因子水準的組合稱為處理 (或稱配方)(Treatment),如A在水準1,B在水準3,C在1(此為1種配方),因此當A有2個水準,B有3個水準,C有3個水準時,共有 2x3x3=18個配方。 (4)反應值:(response)研究目的要量測的品質特性,又稱應變數。

(5)實驗單位:(experiment unit)接受處理的標的物。要在最小的實驗單位量測反應值。實驗單位要力求背景、條件一致(Uniform)。 (6)主效用:(main effect)討論某個因子在各個水準下平均值是否有顯著差異。 (7)交互作用:因子A,B的二階交互作用(Interaction)是討論A設定在水準1時,B的各種水準下Y的平均數差距,與A在水準2 時,B的各水準下Y的平均數差距是否相同,即A,B兩效用是否有可加性的問題,如果兩因子效用沒有可加性,就表示此兩因子有交互作用。如有A,B,C三個因子,則也有三階交互作用AxBxC。

(8)因分析圖(魚骨圖):經品管小組人員腦力激盪下討論出可能影響品質特性的要因,並將它畫成像魚的圖,稱為要因分析圖。如下圖:

§8.2變異數分析的步驟 (一). 單因子變異數分析 One-way ANOVA的目的在比較各分類的均值的大小 1.選定反應變數Y及因子 (分類變數)。若因子的分類種類 (水準) 有k個,則One-way ANOVA的目的在比較各水準下的均值的大小 資料格式

αi 為第i水準的處理效果 (treatment effect), 且 互為獨立 統計模式為 αi 為第i水準的處理效果 (treatment effect), 且 互為獨立 2.變異數分析將總變異的離均差平方和分解成等於組內變異的離均差平方和加上組間變異的離均差平方和。 3.用ANOVA的F檢定,判定 ,成立否。 4.用Levene’s檢定判定k個水準的變異數是否相等(恆常性)。 5.用對比 (contrast) 的設定,比較μi=μ+αi的大小。 6.在ANOVA的F檢定拒絕H0時,用Duncan檢定 (或Tukey檢定) 做μi的兩兩 (成對) 比較,或用Scheffe法做所有可能對比的多重比較,稱為事後比較(Post Hoc 檢定)。少用LSD法,當關心的可能只有少數幾個對比可用Bonferroni法。 7.做殘差分析,檢查 的條件成立否

(二). 雙因子變異數分析 αi 為A因子的主效果 , ;βj為B因子的主效果, ,(αβ) ij為A的第i水準,為B的第j水 Two-way ANOVA的目的在兩因子同時變動時比較兩因子各種水準組合下均值 的大小。 1.選定反應變數Y及兩個因子A、B,統計模式為 αi 為A因子的主效果 , ;βj為B因子的主效果, ,(αβ) ij為A的第i水準,為B的第j水 準的交互作用且 且 互為獨立

2.用Two-way ANOVA的三個F檢定分別判定 , , 否 3.用Levene’s檢定,判定ab個因子水準組合的變異數恆常性 4.若交互作用不存在,A、B兩因子,可分別做Duncan檢定,以比較成對均值的大小 5.若交互作用存在,則A、B兩因子不可分別比較,而只能考慮其ab個組合,一起來比較其均值大小。或給定Ai(Bj)下比較各種Bj(Ai)的均值大小 6.做殘差分析,檢定 的條件成立否

8.3 Statistica操作說明 (一)、單因子單變異數分析 法l. 點選 統計(Statistics) 基本統計/表格(Basic Statistics/Tables) 分割表格與一因子變異數分析(Breakdown & one-way ANOVA)  確定(OK) 在個別表格欄(Individual tables) 按變數(Variables)  選取要分析的反應變數(Dependent variables)與分群變數(Grouping variables)  按確定(OK) 按分群變數編碼值(Codes for grouping variables)全部(All)按確定(OK)確定(OK)按變異數分析與檢定欄(ANOVA & tests)的變異數分析(Analysis of Variance)與Levene檢定(Levene tests),按事後比較欄(Post-hoc)的Scheffe(Scheffe test)檢定與Duncan檢定(Duncan’s multiple range test)

法2. 點選 統計(Statistics) 變異數分析(ANOVA)  在快速欄(Quick)選一因子變異數分析(One-way ANOVA)與快速規格對話方塊(Quick specs dialog)確定(OK)在快速欄(Quick)按變數(Variables)  選取要分析的反應變數與分群變數  按確定(OK) 按分群變數編碼值(Factor codes)全部(All)按確定(OK)確定(OK)在快速欄(Quick)按所有效用與圖表(All effects/Graphs),按所有效用(All effects)按最下方的更多結果(More results)按假設欄(Assumptions)在變異數/共變異數的齊次性欄(Homogeneity of variance/covariances) 按Levene檢定(Levene tests),按事後比較欄(Post-hoc)的Scheffe檢定(Scheffe)與Duncan檢定(Duncan’s)

(二)、二因子變異數分析 Statistica的操作步驟如下: 主效用變異數分析 點選 統計(Statistics) 變異數分析(ANOVA)  在快速欄(Quick)選主效用變異數分析(Main effects ANOVA)與快速規格對話方塊(Quick specs dialog)確定(OK)在快速欄(Quick)按變數(Variables) 選取要分析的反應變數(Dependent variables)與分群變數(Grouping variables)  按確定(OK) 按因子編碼(Factor codes)全部(All)按確定(OK)確定(OK)在快速欄(Quick)按所有效用與圖表(All effects/Graphs),按所有效用(All effects)按最下方的更多結果(More results)按假設欄(Assumptions)在變異數/共變異數的齊次性欄(Homogeneity of variance/covariances) 按Levene檢定(Levene tests),按事後比較欄(Post-hoc)選效用再按Scheffe檢定(Scheffe)與Duncan檢定(Duncan’s)

(二)、二因子變異數分析 因子設計變異數分析 點選 統計(Statistics) 變異數分析(ANOVA)  在快速欄(Quick)選因子設計變異數分析(Factorial ANOVA)與快速規格對話方塊(Quick specs dialog)確定(OK)在快速欄(Quick)按變數(Variables) 選取要分析的反應變數(Dependent variables)與分群變數(Grouping variables)  按確定(OK) 按因子編碼(Factor codes)全部(All)按確定(OK)在快速欄(Quick)按所有效用與圖表(All effects/Graphs),按所有效用(All effects)按最下方的更多結果(More results)按假設欄(Assumptions)在變異數/共變異數的齊次性欄(Homogeneity of variance/covariances) 按Levene檢定(Levene tests),按事後比較欄(Post-hoc)選效用再按Scheffe檢定(Scheffe)與Duncan檢定(Duncan’s)

(二)、二因子變異數分析 特殊因子設計變異數分析 點選 統計(Statistics) 變異數分析(ANOVA)  在快速欄(Quick)選分析精靈(Analysis Wizard)確定(OK) 選取要分析的反應變數(Dependent variables)與分群變數 (Grouping variables)按確定(OK)按自訂組間設計(Custom between design)將類別變數(Categorical)反白在方法欄(Method)按新增(Add)或完全因子(Full factorial),得出設計中的效用按確定(OK)在快速欄(Quick)按所有效用與圖表(All effects/Graphs),按所有效用(All effects)按最下方的更多結果(More results)按假設欄(Assumptions)在變異數/共變異數的齊次性欄(Homogeneity of variance/covariances) 按Levene檢定(Levene tests),按事後比較欄(Post-hoc)選效用再按Scheffe檢定(Scheffe)與Duncan檢定(Duncan’s)

§8.5重複量數 實驗設計時,因受試者不易取得,若受試者重複接受各種處理,則稱為重複量數設計(repeated-measure design)。此時應變數彼此相關,受試者稱為subject是較大的實驗單位,每次接受處理的受試者是較小的實驗單位。因此資料分析方法與ANOVA模式都不同。 例 男女各五名學生先後(重複)接受機械、數學、美術等三種測驗

STATISTICA操作 以Adstudry.sta為例 點選 統計(Statistics) 變異數分析(ANOVA)  在快速欄(Quick)選重複量測變異數分析(Repeated measures ANOVA)與快速規格對話方塊(Quick specs dialog)確定(OK)在快速欄(Quick)按變數(Variables) 選取要分析的反應變數(Dependent variables)與分群變數(Grouping variables)  按確定(OK)在快速欄(Quick)按組內效用(Within effects) 制定組內因子的水準與名稱 按確定(OK)按組間因子編碼(Factor codes)全部(All )按確定(OK)確定(OK)在快速欄(Quick)按所有效用與圖表(All effects/Graphs),按所有效用(All effects)按最下方的更多結果(More results)按假設欄(Assumptions)在變異數/共變異數的齊次性欄(Homogeneity of variance/covariances) 按Box M檢定(Box M test),按事後比較欄(Post-hoc)選效用再按Scheffe檢定(Scheffe)與Duncan檢定(Duncan’s)

性別 學生(Subject) 機械(B1) 數學(B2) 美術(B3) 男(A1) A B C D E 4 9 8 6 1 3 5 女(A2) F G H I J 7 2 11 10 12