謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw 量化研究與統計分析 迴歸分析 謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
第 6 章 複迴歸之一.
單元九:單因子變異數分析.
Chapter 2 簡單迴歸模型.
多元線性迴歸與逐步迴歸 主持人:謝邦昌 教授.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
類別資料分析(Categorical Data Analysis)
第16章 複迴歸.
資料分析:相關和迴歸 第十八章 「行銷研究人員必須持續檢視消費者認知和最終 購買決策之間的關係,因此,相關和迴歸技術為行
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
迴歸分析 8.1 迴歸分析之分類 8.2 迴歸基本原理 8.3 迴歸模型之檢驗 8.4 分析範例
17 類別資料的分析  學習目的.
第十四章 複相關與複迴歸分析 陳順宇 教授 成功大學統計系.
第十三章 簡單線性迴歸 陳順宇 教授 成功大學統計系.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
統計數量分析幾個重要的觀念 陳順宇 教授.
本章重點: 1.迴歸分析及相關分析的意義及方法 2.利用最小平方法來估計迴歸方程式 3.相關分析與迴歸分析的關係
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第十四章 羅聖強 姜燕 調節變項與中介變項 報告學生:蘇世名 指導老師:任維廉教授 國立交通大學 2010/6/1.
Simple Linear Regression -2
Ch7:一般線性模式 GLM.
Regression for binary outcomes
Simple Linear Regression -4
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
第14章 迴歸分析與複迴歸分析  本章的學習主題  1.使用迴歸分析的時機 2.最小平方法在迴歸分析上的意義 3.迴歸分析的假設
第14章 迴歸分析與複迴歸分析  本章的學習主題 
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
課程九 迴歸與相關2.
邏輯迴歸 Logistic Regression
Chapter 3 Association: Contingency, Correlation, and Regression
第 14 章 簡單迴歸.
第 7 章 複迴歸之二.
數位化學習滿意度關鍵影響因素之研究 國立高雄師範大學 資訊教育研究所.
Discriminant Analysis
單一分配 Uniform distribution
相關與迴歸 Correlation and Regression
第 14 章 簡單線性迴歸.
複迴歸分析-2 Multiple Regression.
第十一章 相關研究法.
Chapter 3 複迴歸分析: 估計.
複迴歸分析-1 Multiple Regression.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第 五 章 複迴歸分析.
第一章 直角坐標系 1-3 函數圖形.
國立台灣體育學院 體育學系暨體育研究所 高明峰
第一章.
Definition of Trace Function
第 一 章 多元迴歸分析.
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
第 15 章 複迴歸 © 滄海書局.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
大綱:加減法的化簡 乘除法的化簡 去括號法則 蘇奕君 台灣數位學習科技股份有限公司
兩變數間的關係: 名義和次序資料的表格描述
第一章.
Chapter 4 迴歸分析. Chapter 4 迴歸分析 迴歸分析原理 迴歸分析的目的在於找出一條最能夠代表所有觀測資料(樣本點)的函數(迴歸估計式),用這個函數代表應變數和自變數之間的關係 多變量分析—管理上的應用.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
Linear Regression Analysis 5E Montgomery, Peck & Vining
第一章 直角坐標系 1-3 函數及其圖形.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第十七講 重積分 應用統計資訊學系 網路教學課程 第十七講.
Presentation transcript:

謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw 量化研究與統計分析 迴歸分析 謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw

自變數 依變數 統計分析方法 類別 交叉表 連續 變異數分析 相關分析:關係強度 迴歸分析:因果

迴歸 線性關係的分析 相關分析可以描述兩個連續變數的線性關係,若要進一步確認兩個變數之間的因果關係,則應採用迴歸分析 迴歸分析係用以由自變項(獨立變項)預測依變項,或是研究實驗控制(因)對被觀察的變項(果)的影響 例:由父母身高預測子女身高; 用人口成長(自變項)預測(解釋)電話用戶數的成長 例2:由圖書館利用頻率,預測圖書館網站的利用頻率

簡單迴歸 Simple Regression 利用單一的預測變數(自變數)去預測另一依變數 簡單迴歸方程式: Y= a + bX 以單一自變項X,預測依變項Y b為迴歸係數(regression coefficient),代表以X預測Y,其預測力之大小 例:以智商預測學業表現的迴歸分析方程式為:Y(學業表現)y= a + b(智商)x

Y = a + bX 在線性關係中,若兩變項之關係是完全相關時(r=1正相關或r=-1負相關),X與Y的關係呈一直線,兩變項之觀察值可以完全被方程式所涵蓋,其中b為斜率, a為截距,代入X可求得Y,代入Y可求得X,無須預測。 但是當兩變項間的關係未達到完全相關時(r±1),X與Y的關係是分佈在一個區域內,無法以一條直線來表示,而必須以最小平方法來求取一條最具代表性的線,此線稱為最適線(best-fit line)或迴歸線(regression line),再利用迴歸線來預測因果關係。

By.x 是迴歸係數,表示每當X變動一個單位時,Y的變動量 以X預測Y(X Y) By.x 是迴歸係數,表示每當X變動一個單位時,Y的變動量 例:以身高預測體重, Y= -165.35 +1.3426X, 表示身高每變動一公分, 體重增加 1.3426公斤 標準化迴歸係數(standardized regression coefficient),去除特定單位

‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ ‧ 身高 vs. 體重

簡單迴歸分析 程序: 分析>迴歸方法>線性

迴歸方法 強迫進入(enter):強制一次進入式迴歸分析法,為預設 逐步迴歸分析(stepwise) 刪除(remove)::強制剔除式迴歸分析法 向後(backward) :後向剔除迴歸分析法 向前(forward)

Durbin-Watson統計量 檢定迴歸模型中殘差獨立的假設 如果相鄰殘差項間是相關,則其總差異必小或大 若殘差項間是正相關,則其差異必小 若殘差項間是負相關,則其差異必大 當DW值愈接近2時,殘差項間愈無相關 當DW值愈接近0時,殘差項間正相關愈強 當DW值愈接近4時,殘差項間負相關愈強

驗證常態分配 驗證誤差變項是否具常態分配,可繪殘差次數分配圖,概略判斷母群體的誤差變數是否是常態分配?平均數是否為零 利用常態點圖(normal plot),將每個殘差分別描繪在圖上,若誤差變數是常態分配,則圖上點之連線應近似一直線

期中考和期末考的Pearson相關係數為0.822,在0.01水準下達到顯著,進一步檢驗其影響關係

適合度檢定: 期中考可以解釋期末考67. 6%的變異。調整後的R平方為63. 5%,F=16. 66,p=0. 004在0

簡單線性迴歸方程式為: Final = 49.369 + 0.434 Midterm 期中考成績能夠有效預測期末考成績,Beta係數達0.822(t=4.082, p=0.004),表示期中考成績愈高,期末考成績也愈高。

由上述分析可知,以期中考來解釋或預測期末考成績是相當合適的,而且所建立的模式也令人滿此,但是是否真能用該模式呢? 必須再進一步作殘差分析,以判定該模式是否符合簡單線性迴歸模型的假設。

殘差分析 由標準化殘差次數分配圖(左)和標準化殘差常態機率分配P-P圖(右),可看出殘差的機率分配並不接近常態機率分配

多元迴歸 multiple regression

多元迴歸 multiple regression 複迴歸 利用多個預測變數(自變數)去預測另一依變數 例:以智商、閱讀時間和與他人討論頻率,三個變項來預測學業表現 Y(學業表現)=b1X1(智商)+b2x2 (閱讀時間)+b3x3(討論頻率)+ b1、b2、b3三個迴歸係數代表X1(智商)、 x2 (閱讀時間)、x3(討論頻率)三個變項對Y的預測能力 多元迴歸同時處理多個迴歸係數,必須考慮預測變項之間是否有共變關係存在,因為預測變項間之共變關係將影響迴歸係數之計算,必須加以控制

設有k+1個變數,Y和X1, X2 , … , Xk,其中Xi ,i=1,2,… 設有k+1個變數,Y和X1, X2 , … , Xk,其中Xi ,i=1,2,….,k,為k個自變數(或獨立變數),是一種能事先準確觀測的變量(即可忽略其誤差), 因此它們不是隨機變數,而無機率分配的性質。 Y為依變數,或「被解釋變數」,是依Xi之值而改變的隨機變數,即當Xi之值為Xij時,Yj亦為一隨機變數,可表示為Yj(即Yj=y| X1j、X2j、… 、 Xkj)

多元迴歸模型的假設是: 依變數Y之期望值為自變數Xi ,i=1,2,….,k,之線性函數 設有n 組資料, ( X11、X21、… 、 Xk1,Y1 ) ( X12、X22、… 、 Xk2,Y2 ) ….. ( X1n、X2n、… 、 Xkn,Yn ) 則多元線性迴歸模型為: Y1 =+1 X11+ 2 X21+… + k Xk1+1 Y2 =+1 X12+ 2 X22+… + k Xk2 +2 (1) …. Yn =+1 X1n+ 2 X2n+… + k Xkn +n 其中1 , i=1,2,….,n,為獨立的隨機殘差變數(即Cov(i, j)=0),每個均為一具有期望值為0,變異數為2的常態分配,即N(0,2)

多元迴歸的分析模式 同時分析法(simultaneous multiple regression) 所有預測變項同時納入迴歸方程式中,對依變項進行預測。 強制進入法:在一定顯著水準下,將所有對依變項有解釋能力的預測變項全部納入迴歸方程式,不考慮變項間的關係,計算所有變項的迴歸係數 強制淘汰法:在一定顯著水準下,將所有對依變項沒有解釋力的預測變項,不考慮預測變項間的關係,一次全部排除在迴歸方程式之外,再計算所有保留在迴歸方程式中的預測變數的迴歸僄數。

多元迴歸的分析模式 逐步分析法(stepwise multiple regression) 依據預測變項的解釋力的大小,逐步檢視每一個預測變項的影響。 順向進入法(forward):首先選用達到顯著水準且具有最大預測力的獨立變項,然後依序納入方程式中,直到所有達到顯著的預測變項全部被納入迴歸方程式中 反向淘汱法(backward):將所有預測變項以同時分析法納入迴歸方程式中,然後逐步的將未達到顯著性的預測變項,以最弱、次弱的順序自方程式中排除,直到所有未達顯著的預測變項都被淘汰完畢為止 逐步分析法(stepwise):以forward順序納入最具預測力的獨立變項,同時以 backward法檢驗留在方程式中的所有預測變項,若有任何未達顯著水準的預測變項便將其淘汰,是最常用的迴歸分析模式

多元迴歸的分析模式 階層分析法 預測變項間具有特定的先後關係時,應依研究者的設計,以特定順序來進行分析。 路徑分析 例:以性別、社經地位、自尊、焦慮感與努力程度,來預測學業成就時,性別與社經地位是人口統計變項,不受其他預測變項的影響;而自尊與焦慮是情意變項,彼此間具有高度相關,也可能受到其他變項的影饗;因此四個變項可以分成兩個階段,先將人口統計變項強制進入迴歸分析,計算迴歸係數,然後再將情意變項以逐步分析法計算自尊與焦慮的各自預測力。 路徑分析

分析程序 分析>迴歸方法>線性

由各變項之相關矩陣可知,除了性別與總平均外,各變項之相關達到顯著

顯示納入迴歸方程式之自變項

由模式摘要可知,所有自變項對依變項(學業總平均)的整體解釋力為94.7%;調整後的R平方為90.5%(小樣本)。

由變異數分析表可知,整體迴歸模式達到顯著,F=22.544, p=0.002,表示前述96.7%的迴歸解釋力是具有統計意義。

再由係數分析表可知,缺席次數與期中考成績之B值達到顯著差異。

非線性迴歸分析 類別資料的迴歸分析 自變項為類別變項時,,原無法適用於線性關係分析,如性別、婚姻狀態等,為使類別變項也可以和其他連續變項一起納入迴歸分析模式中進行預測,迴歸分析發展出一套虛擬變項(dummy variable)的方式,在進行迴歸分析之前,將類別變項轉換成連續變項的型態,再依一般程序進行分析。 例:婚姻狀態

非線性迴歸分析 類別資料的迴歸分析 例:婚姻狀態 1:鰥寡 2:離異 3:未婚 4:已婚 因為1~4並非等距尺度,若直接以此類別變項進行迴歸分析,勢將違反線性關係之假設,因此,將性別變項依四個水準分成四個二分變項,每個變項是1表示是,0表示否

虛擬變項 編號 原始變項 mar1 mar2 mar3 mar4 001 1 002 2 003 3 004 4

參照組(reference group) 一個具有K個水準的類別變項,可以轉換成K個虛擬變項,然在實際執行迴歸分析時,第K組是K-1組的數值全部為0,故實際只要K-1組,以免造成變項的多元共線性問題 未經虛擬處理的水準,即稱為參照組 參照組不一定是最後一個水準,而宜取用內容明確清楚,樣本數適中的水準作為參照組。如「其他」就不適合做為參照組;有順序關係時,如教育水準,可以選擇最高等級、最低或中間等級,作為參照組

非線性迴歸分析 程序 分析 > 迴歸方法 >曲線估計

由上圖可知,線性估計(綠線)無法符合觀察值的分佈狀況;二次曲線的估計(紅線)最符合觀察值的分佈狀況。

由於二次曲線最符合觀察值的分佈,故焦慮變項應以二次式模型來解釋績效表現。 整體迴歸解釋力R2為0.852(R Square);換句話說,焦慮可以解釋績效表現達85.2%的變異量(F=20.1, P<0.01)。二次項的標準化迴歸係數(Beta)為-4.17,t=-4.395, p<0.01; 一次項的標準化迴歸係數(Beta)為3.46, t=3.64, p<0.01。

路徑分析(Path Analysis) 多重變項間之因果關係結構模式 變項必須是連續變數 路徑圖(Path diagram),用以描繪變項間之關係,如: 自我效能感 社會期待 成就動機 學業表現

假設1:自我效能感與社會期待影響個人的成就動機 學業表現 社會期待 多元迴歸 依變項:成就動機 自變項:自我效能感、社會期待

假設2:自我效能感、社會期待與成就動機影響學業表現 多元迴歸 依變項:學業表現 自變項:自我效能感、社會期待、成就動機

假設3:自我效能感與社會期待具有相關 自我效能感 成就動機 學業表現 社會期待

外衍變項(exogenous variable),僅作為自變項者,如前例之社會期待,其不受其他變項的影響,其變異量由不屬於路徑模型的其他變項所決定。 外衍變項間可能具有相關,也可能相互獨立,但是其關係並不影響路徑模型內的因果關係

內衍變項(endogenous variable)僅作為依變項,如前例之學業表現,其變異量完全由路徑模型中的其他變項的線性組合所決定。 成就動機兼具自變項與依變項的雙重身份,然其變異量由路徑模式中的自我效能感和社會期待兩因素所決定,亦為內衍變項。

直接效果與間接效果 .29** 自我效能感 社會期待 成就動機 學業表現 .63*** .21** .13* .02 .16* 自我效能對成就動機和學業表現,均有直接效果,路徑分數分別為0.29 (p<0.01)與0.63 (p<0.001);同時成就動機對學業表現亦有顯著的直接效果(beta=0.21, p<0.01)。因此,自我效能對學業表現的影響,除了具有直接效果之外,尚具有一由成就動機中介的間接效果,其強度為兩個直接效果的乘積(0.21*0.63=0.18)

至於社會期待,其對成就動機的預測力不足(beta=0.02, n.s.),直接效果不明顯,但是對於學業表現仍具有直接預測力(beta=0.16, p<0.05),但是社會期待無法藉由成就動機來間接影響學業成績