Download presentation
Presentation is loading. Please wait.
Published byΚαλλίστη Γεννάδιος Modified 5年之前
2
Chapter 4 迴歸分析
3
迴歸分析原理 迴歸分析的目的在於找出一條最能夠代表所有觀測資料(樣本點)的函數(迴歸估計式),用這個函數代表應變數和自變數之間的關係
多變量分析—管理上的應用
4
迴歸分析原理 最小平方法 在進行樣本迴歸線的估計時,基本的想法是:最好的樣本迴歸線應該使得估計值()和觀測值(Y)間的差距最小。先計算出樣本點和迴歸線在Y軸方向距離(e)平方的總和,在極小化的要求下,分別對a、b(樣本迴歸係數)偏微分,再進行聯立求解,即可得到a、b 多變量分析—管理上的應用
5
簡單線性迴歸分析 應用時機 統計模型 簡單線性迴歸分析可以應用在:(1)以單一變數進行預測,(2)判斷二個變數之間相關的方向和程度
若由機率分佈的角度來看,則母體迴歸式表示X與條件期望值E(Y∣X)之間的關係,此時上式亦可表示為 多變量分析—管理上的應用
6
簡單線性迴歸分析 簡單線性迴歸模型基本假設
Xi為獨立變數X的第i個觀測值,Yi為對應Xi的應變數觀測值;而參數α、β為X、Y線性關係的係數。 (1)在各個Xi之下所對應的Y,其平均值可表示為下列線性迴歸式:E(Y)= α+βXi (2)對每一個Xi而言,其所應的Y為變異數相等的分配,即Var(Y∣Xi)=σ^2 (3)Yi之間無關,且其共變數為0,即應變數任意觀測值之間無線性關係。Cov(Yi, Yj)=0 (4)自變數X為非隨機變數,且至少應該有兩個以上不同的觀測值 (5)若使用最大概似估計法時,應該先假設應變數為某一分配;而在利用OLSE估計後,進行參數檢定時,應假設Y為常態分配:Y~N[(α+βX,σ^2] 多變量分析—管理上的應用
7
簡單線性迴歸分析 參數估計--最小平方估計法 (Ordinary Least Square Estimation,OLSE)
多變量分析—管理上的應用
8
簡單線性迴歸分析 斜率β的抽樣分配、信賴區間及檢定 β的抽樣分配 β的信賴區間 β的統計檢定 多變量分析—管理上的應用
9
簡單線性迴歸分析 截距α的抽樣分配、信賴區間及檢定 α的抽樣分配 α的信賴區間 α的統計檢定 多變量分析—管理上的應用
10
觀測值、估計值和平均值的關係 F統計量檢定 多變量分析—管理上的應用
11
判定係數 判定係數值愈接近1,表示所設定的迴歸模型愈適合描繪X、Y之間的關係 多變量分析—管理上的應用
12
實例與應用4-1 模型設定 參數估計 模型判斷 尖峰用電=a+b╳氣溫 尖峰用電估計值=-95.913+3.609╳氣溫
由Model Summary表中可知,判定係數(R Square)為0.745;由ANOVA表可知,p值小於0.05顯著水準,表示整體而言,上述樣本迴歸線可以描繪氣溫和用電量的關係。 在Coefficient表中,t檢定的結果,常數項係數的p值為0.02、自變項係數的p值為0,皆小於0.05,表示此二個參數的估計在統計上顯著異於0 多變量分析—管理上的應用
13
複迴歸模型與虛擬變數 虛擬變數應用時機 模型設定考量因素
自變數為屬質的資料(如:性別、畢業學校、產業別),或者是由問卷調查所得的結果(如:所得級距、量表資料) 考慮季節性或循環因素時 模型設定考量因素 經濟性 相關性 自變數和應變數的相關性 自變數之間的相關性 重要性 多變量分析—管理上的應用
14
複迴歸模型 複迴歸模型的基本假設 多變量分析—管理上的應用
15
虛擬變數迴歸模型 虛擬變數迴歸模型的一般式 虛擬變數的設定 當一變數有n種情況時,必須設定n-1個虛擬變數 多個變數、多項虛擬變數的設定
將解釋變數設為「性別」及「求學地區」,各設定一個虛擬變數 將解釋變數設為「個人背景」,設定3個虛擬變數 多變量分析—管理上的應用
16
實例與應用4-2 分析一 在未考慮季節虛擬變數之下,修正後判定係數為0.362,而ANOVA表中F檢定的p-value小於顯著水準0.05,整體模式尚能適合用來解釋樣本資料 多變量分析—管理上的應用
17
實例與應用4-2 分析一 在係數表中,自變數標準化係數的t檢定僅存貨(STOCK)的參數項無法拒絕為0,表示ROE可能和存貨無關
多變量分析—管理上的應用
18
實例與應用4-2 分析二 在考慮季節虛擬變數之下,修正後判定係數為0.458,而ANOVA表中F檢定的p-value小於顯著水準0.05,相關係數明顯提高,表示模型比分析一的模型還適合 多變量分析—管理上的應用
19
實例與應用4-2 分析二 在係數表中,自變數標準化係數的t檢定有短期負債(SDEBT)、存貨(STOCK)、D1等三項變數的參數項無法拒絕為0,表示在考慮季節之下,ROE可能和短期負債、存貨無顯著相關 多變量分析—管理上的應用
20
簡單虛擬迴歸和變異數分析 變異數分析可以利用F統計量檢定不同情況之間是否有顯著差異,而迴歸分析除了前述功能之外,還可以表示差異的程度和相關的方向,同時,其結果也可以用來進行預測 變異數分析假設母體態分配,而且各組的變異數相等,必須先檢定樣本是否符合假設;但迴歸分析則無以上限制 多變量分析—管理上的應用
21
實例與應用4-3 變異數分析 虛擬迴歸分析 F值為11,大於臨界值(=4),其P-value為0,表示不同性別的購買次數有顯著差異
由迴歸結果可知,男女的購買次數有顯著差異,且男性的期望購買次數為5次、女性的期望購買次數為3次 多變量分析—管理上的應用
22
虛擬變數的不同應用型態 多變量分析—管理上的應用
23
虛擬變數的不同應用型態 多變量分析—管理上的應用
24
虛擬變數的不同應用型態 多變量分析—管理上的應用
25
結果解讀 複判定係數 修正後複判定數 偏判定係數 多變量分析—管理上的應用
26
迴歸分析的分析步驟 設立模型 參數估計 模型判斷 結果應用 考慮自變數的屬性(屬量或屬質)和數目(變數並非愈多愈好)
參數估計的方法一般採最小平方法,迴歸模型中估計的參數包括:常數項係數、自變項係數、判定係數 模型判斷 參數檢定:前述參數之檢定及模型整體F檢定 假設檢定:殘差項常態分配適合度檢定、共線性、異質變異、自我相關檢定、線性判斷 結果應用 迴歸分析能夠表示變數之間的關係,且具有預測的作用 在用樣本迴歸估計式進行預測時,應注意自變數範圍若大於樣本全距,則發生預測誤差的可能性就會提高 由迴歸分析的結果只能判斷自變數和應變數的相關程度,二者之間並不一定有因果關係 多變量分析—管理上的應用
27
相關、變異數分析和迴歸分析的變數比較 多變量分析—管理上的應用
Similar presentations