Liner regression analysis 線性迴歸分析
迴歸(Regression) 簡單線性迴歸 自變數個數:簡單迴歸、多元迴歸(複回歸) 分布圖形:線性迴歸、非線性迴歸
y=β0+β1x 劑量與症狀解決持續天數 劑量X 症狀解決持續天數Y 3 9 5 4 12 6 14 16 7 22 8 18 24
迴歸係數(regression coefficient) β0:直線y軸的截距 β1 :直線的斜率 統計模型 yi=β0+β1xi+ei
最小平方法(method of least square) β0、β1的估計方法 估計的回歸直線 ŷ=b0+ b1x yi與ŷ之垂直距離 對取偏微分,令方程式等於0即可得解
最佳的適配迴歸方程式 ŷ=b0+ b1x
Example b1=SSxy / SSx = 112.1 / 40.9 = 2.74 劑量與症狀解決持續天數 劑量X 症狀解決持續天數Y 3 9 5 4 12 6 14 16 7 22 8 18 24 b1=SSxy / SSx = 112.1 / 40.9 = 2.74 b0=(1/n)∑yi – (b1/n)∑xi = (151/10) – (2.74/10)59 = -1.07 ŷ=-1.07 + 2.74x
總變異 = 無法解釋的變異 + 迴歸變異 SST = SSE + SSR 觀察值與直線 ŷ=b0+ b1x之離差 迴歸變異分析圖
判定係數 (coefficient of determination) Unexplained variation: sum of square due to error Explained variation: sum of square due to regression 決定係數 or 判定係數 (coefficient of determination) R2 = SSR/SST
R2的特性 R2 = SSR/SST 比值介於 0~1。 迴歸模型的解釋力。迴歸關係強度。 SST = SSE + SSR
相關係數(Correlation coefficient) x、y兩變項相互間關係之密切程度有很大關係,而x、y兩變項之關係強度我們稱為相關。 相關係數,在+1.00至 -1.00之間。 正相關:x變項之值愈大(小)則y變項之值愈大(小);(其值在0~1) 負相關:x變項之值愈大(小)則y變項之值愈小(大);(其值在 –1~0) 零相關:兩變項間找不出有什麼關係。(其值為0) 完全相關:相關係數為+1或-1時稱之 。
相關係數之絕對值: 0.8以上 非常強的相關 0.6~0.8 強相關 0.4~0.6 中等相關 0.2~0.4 低相關 0.2以下 非常低的相關
分佈圖形與相關性
迴歸變異數分析表
信賴區間與預測區間之圖示