迴歸分析 行銷、財務、人資研究
1. 迴歸分析基本概念 目的 1. 解釋現象:找出重要的解釋變數來解釋現象,並證明解釋模式成立。 2. 預測未來:利用此解釋模式,代入解釋變數值,預測未來 3. 瞭解變數關係:從解釋模式中,可瞭解解釋變數對現象是正向或反向影響,但注意迴歸無法判定「因果關係」
1.1 簡單迴歸分析函數關係 簡單迴歸分析探討單一分析性反應變量(Y)受一個分析性解釋變數之影響,函數關係如下: Y=f(X) 其中
1.2 範例--身高與體重 利用簡單迴歸分析探討由體重(X)來解釋身高(Y),函數關係如下: Y=f(X) 其中
1.3 收集樣本並繪圖 研究目的:預測朝陽學生的身高 樣本:收集本班的身高與體重數據 利用Excel工具資料分析迴歸
1.4 研究結果分析 估計式 推論 身高與體重關係? 朝陽路人甲的體重=60身高=?
1.5 應用 行銷管理 所得(X)預測咖啡飲用量(Y) 財務管理 多少所得的人會喝多少咖啡 市場定位 大盤加權指數(X)預測個股價格(Y) 資本資產定價理論
1.6 多元迴歸分析函數關係 多元迴歸分析探討單一分析性反應變量(Y)受n個分析性解釋變數(X1,X2,...,Xn)之影響,函數關係如下: Y=f(X1,X2,X3,...,Xn) 其中 Y=分析性反應變量 Xk=第k個分析性解釋變數,k=1,2,...,n 應用例如:服務業展店公式營業額=f(人潮,車潮)
2. 線性關係的分析原理 線性關係 linear relationship:指兩個變項的關係可以被一條最具代表性的直線來表達之時,所存在的關連情形。 該直線之方程式為Y= 0+1X 0是截距項 1為斜率(即Δy/Δx,每單位的X變動時,在Y軸上所變動的量) 當解釋變數(X)為1個時稱為簡單迴歸 當解釋變數(X)為2個以上時稱為多元迴歸
2.1 簡單迴歸模式參數0、1的估計 要如何得到迴歸線? 迴歸係數0、1未知,因此必須利用樣本資料去估計0及1,一般統計理論中,有很多種估計方法,通常採用普通最小平方法(Ordinary Least Squares Method) 利用樣本找出一條最適合之直線方程式 用以估計E(Y)與預測Y。希望找到的直線能使實際值(Yi)和預測值( )之差異平方和為最小,即,使得
2.2 多元迴歸分析係數估計 多元(複)迴歸模式及其假設如下: i =1, 2, ..., n 利用最小平方法進行複迴歸參數的點估計 考慮兩個預測變項的複迴歸模式如下: 其與簡單線性迴歸模式一樣,找 0, 1, 2 使誤差平方和D為最小: 將D分別對 0, 1, 2 取偏微分,並令其等於零,可得下列的聯立方程組,亦稱為標準方程組(Normal Equation)
可解聯立得到 其中,
2.3 檢定流程
2.3.1 總檢定 目的 探討迴歸模式中的所有斜率係數是否全部為0 判定 H0:βk=0,對所有k H1:βk ≠ 0,對某些k 使用F統計量或p-value判斷 不拒絕H0(不顯著)表示β1=β2...βk=0,代表K個變數不具解釋力,即模式不顯著,不值得進一步研究 拒絕H0表示並非完全不具解釋力,至少有一個以上的βk不等於0
2.3.2 邊際檢定—各別迴歸係數的統計推論 目的 判定 探討個別迴歸係數是否顯著異於某一個特定數值,以簡單迴歸為例,只需探討1個迴歸係數,如下: H0:β1=0 H1:β1≠0 判定 使用t統計量或p-value判斷
若拒絕虛無假設(即10)X與Y具有線性相關 (即預測變數X每增加一單位時,Y的平均增加量為1) 至於是正相關還是負相關直接觀察估計式正負號即可 若無法拒絕虛無假設(1=0),不能推論X與Y無關。此時可能有兩種情況: 1. 為抽樣不客觀或樣本數太少而無法拒絕虛無假設(即犯Type II Error)。 2. 為預測變項(X)與效標變項(Y)之間確實無線性關係,但可能存在非線性關係。
2.4 判定係數 判定係數(R2):衡量模式解釋力,亦即總變異中可被解釋之百分比例。亦是衡量模式配適度之指標,值愈大表示變數解釋能力愈高。 迴歸總變異之分解:從ANOVA表可知 總變異=可解釋變異+未解釋變異 SSTO=SSR+SSE SSTO=迴歸平方和+殘差平方和 R2 =SSR/SSTO
實例說明-- R2 為瞭解商店營業額(Y)之決定因素,首先選取固定人口(X1)來作迴歸,實證顯示此一模式R2 =0.64。
判定準則 一般實務上,使用「調整後判定係數」較好,來判定模式力解釋力好壞 橫斷面資料:與時間無關的資料 縱斷面資料:與時間有關的資料
2.3.3 身高與體重假設檢定結果
3. 實證分析行銷案例-統一左岸咖啡 市場定位策略—所得定位 Y=f(X) Y=左岸咖啡之使用頻率,如每週飲用罐數
3.1 簡單迴歸模式 yn=β0+β1xn+εn yn=第n位受訪者之使用頻率 xn=第n位受訪者之每月所得 β0=截距項 β1=斜率項,代表個人所得增加一單位時,使用頻率之變動數 εn=誤差項
3.2 總檢定、邊際檢定、調整後判定係數 總檢定:判定模式是否成立 邊際檢定:由於行銷個案是簡單迴歸分析只有β1需進行檢定判定所得(x)是否能顯著影響咖啡飲用量(y) 注意簡單迴歸分析的總檢定與邊際檢定是相同的 調整後判定係數:考慮所得(x)變數的迴歸模式解釋力
4. 實例說明與SPSS操作 SPSS選項(詳見「量化研究與統計分析」13-22)
SPSS選項
4.1 總檢定 總檢定之檢定統計量來自於ANOVA表之F值與p值,如上表所示F統計量=46.236,p值=0.000小於顯著水準0.05。表示模式成立,並值得進一步研究。
4.2 β1的邊際檢定 估計式為Y=-0.566+0.045X β1之t統計量=6.800,p值=0.000小於顯著水準0.05。宣稱迴歸係數顯著異於零,左岸咖啡飲用量受所得影響,不能採「非所得訴求策略」,且影響為正相關。 注意簡單迴歸分析的總檢定與邊際檢定相同(F=t2)
4.3 調整後判定係數 調整後R平方=0.537 代表模式解釋力十全十美模式合適度十全十美
4.4 行銷意涵—所得定位 所得彈性:衡量消費者變動1%所得影響消費數量變動多少%之反應程度 公式:EI=Q% / I%=數量變動百分比 / 所得變動百分比 當EI<-1時,產品適合低所得定位,如黑白電視機 當-1<EI<0時,產品適合低所得訴求,如檳榔 當EI=0時,產品適合非所得訴求,如米 當0<EI<1時,適合高所得訴求,如電漿電視 當EI>1時,適合高所得定位,如LV
4.4.1 所得定位實證結果 模式估計 Y=-0.566+0.045X X平均數=32.75(千元) Y平均數=0.9(罐) 公式:EI=0.045*32.75/0.9=1.6375 研究結論:依據消費者的樣本資料顯示所得彈性>1,故可採用高所得定位策略,亦即對象以高所得之消費者為主。
4.4.2 觀察迴歸模式 模式估計 Y=-0.566+0.045X 研究結論:依據消費者的樣本資料顯示所得(X)=0時,消費者僅喝-0.566罐。 並發現所得會顯著影響消費者咖啡飲用量(總檢定與邊際檢定結果) 且所得與咖啡飲用量成正相關(即所得增加咖啡飲用量增加) 模式設立時已隱含所得(因)得到咖啡飲用量(果)
4.4.3 因果關係 迴歸模式設立時,找出具解釋力的變數,與變數之間到底誰是因誰是果,需靠研究者自行判斷(理論基礎、實務經驗、…等) 例如:此行銷範例,到底是所得影響飲用量,還是飲用量影響所得,迴歸無法判定實證結果的因果關係是否正確,進一步可使用路徑分析及LISREL。
5. 實證分析財務管理-CAPM模型 資本資產訂價理論 Y=f(X) Y=個股報酬率 X=大盤指數報酬率 用大盤預測個股 33 33
5.1 台灣經濟新報資料庫TEJ介紹 台灣經濟新報(TEJ)提供證券金融市場基本分析所需資訊 包括:國內上市櫃公司基本資料、月營收盈餘、董監事持股狀況、庫藏股資料、財務報表、調整股價與未調整股價、外資法人持股與買賣超、期貨與選擇權交易、基金、債券以及未上市公司財務資訊等,是國內專業財報分析資料庫,幫助您分析財經資訊。 進入方式朝陽圖書館資料庫台灣經濟新報 34 34
5.1.1 安裝TEJ 35 35
5.1.2 資料取得操作 36 36
5.1.3 上市櫃股價報酬率資料 上市櫃股價報酬率滑鼠點二下 37 37
5.2 簡單迴歸模式 yn=β0+β1xn+εn yn=第n日個股之日報酬率 xn=第n日大盤之日報酬率 β0=截距項 β1=斜率項,稱為貝它係數,個別資產報酬受到市場風險影響的大小 εn=誤差項 38 38
5.2.1 總檢定 39 39
5.2.2 β1的邊際檢定 40 40
5.2.3 調整後判定係數 41 41
5.3 財務意涵—CAPM 目的:協助投資人決定資本資產的價格 單一證券的預期報酬 無風險利率+系統風險溢酬+非系統風險溢酬 風險溢酬:承擔風險的補儐 理性投資人 多角化投資組合 消除非系統風險 只需觀察市場風險(系統風險) 42 42
5.3.1 CAPM Model CAPM的公式:(p.128) 證券預期報酬率 無風險利率(Rf) + 證券的市場風險溢酬 市場風險溢酬 E(Rm) Rf β:個別資產報酬受到市場風險影響的大小
5.3.2 貝他係數 CAPM的公式:(p.128) β=1(p.129) β=2 表示當市場報酬變動1%,證券報酬也變動1% 5.3.2 貝他係數 CAPM的公式:(p.128) β=1(p.129) 表示當市場報酬變動1%,證券報酬也變動1% 證券風險完全等於市場風險 β=2 表示證券風險是市場風險的2倍
5.3.3 證券市場線 E (Ri ) , % H 30 25 20 15 A 10 20%,高風險證券的溢酬 L 10% 5% ,市場風險 0.5 1.0 2.0
5.3.4 結論
6. 實證分析--人力資源管理 研究主題: 企業組織環境、企業組織學習、企業知識管理對企業組織效能的影響(回收問卷1200份) 福利措施 同儕關係 組織環境 適應學習 創新學習 組織學習 組織效能 知識管理 知識獲取 知識流通 知識創新 47 47
6.1 多元迴歸模式 Y=f(X1,X2,X3,X4,X5,X6,X7) Y=組織效能 X1=福利措施 X2=同儕關係 X3=適應學習 48 48
6.2 SPSS操作 49 49
6.2.1 總檢定 如上表所示F統計量=235.344,p值=.000小於顯著水準0.05。表示模式成立,亦即表示迴歸方程式中,至少有一個以上迴歸係數不等於0,並值得進一步研究。(理論參考2.3.1節) 50 50
6.2.2 邊際檢定 估計式: 創新學習(X4)與知識流通(X5)p值>0.05,表示此二變數未顯著影響組織效能,考慮刪除,但仍需參考相關分析結果。 51 51
6.2.3 判定係數 調整後R平方=0.578,表示七個解釋變項共可解釋「組織效能」57.8%的變異。 52 52
6.3 相關分析 相關係數範圍 關聯程度 1.00 完全相關 0.7~0.99 高度相關 0.4~0.69 中度相關 0.1~0.39 低度相關 0.1以下 微弱或無相關 53 53
結果 所有變數皆具中度相關 54 54
6.4 模式建立—變數選擇 邏輯基礎—實務經驗、理論、專家…等 統計量基礎—強迫進入變數法、逐步多元迴歸分析法、向前法、向後法、刪除法 55
6.4.1 逐步迴歸分析 自動選解釋變數功能 56 56
6.4.2 輸出結果 最好模式:選表的最後一個模式 57 57
6.4.3 判定係數 隨著解釋變數加入解釋力顯著地增加直到第五個為止 因此,取這5個解釋變數是最好的 58 58
6.5 殘差分析 常態性假定 恒常性假定 獨立性假定 正式論文之迴歸分析需驗證三個假定成立(詳見13-19)當這些假定違反,將導致結論偏誤的發生 59 59