本章重點: 1.迴歸分析及相關分析的意義及方法 2.利用最小平方法來估計迴歸方程式 3.相關分析與迴歸分析的關係

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
單元九:單因子變異數分析.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理 與圖表編製。.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理與圖表編製。.
Chapter 2 簡單迴歸模型.
双变量关联性分析.
中二數學 第五章 : 二元一次方程 二元一次方程的圖像.
第16章 複迴歸.
資料分析:相關和迴歸 第十八章 「行銷研究人員必須持續檢視消費者認知和最終 購買決策之間的關係,因此,相關和迴歸技術為行
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
Keller: Stats for Mgmt & Econ, 7th Ed 簡單線性迴歸和相關分析
§9.3 线性回归分析 一. 什么是回归分析 相关分析研究变量之间相关的方向和相关的程度,但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。 回归分析则是研究变量之间的数量变化规律的一种方法。
17 類別資料的分析  學習目的.
第十四章 複相關與複迴歸分析 陳順宇 教授 成功大學統計系.
第十三章 簡單線性迴歸 陳順宇 教授 成功大學統計系.
認識倍數(一) 設計者:建功國小 盧建宏.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
統計數量分析幾個重要的觀念 陳順宇 教授.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
Chapter 5 迴圈.
Simple Linear Regression -2
Simple Linear Regression -4
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
第14章 迴歸分析與複迴歸分析  本章的學習主題  1.使用迴歸分析的時機 2.最小平方法在迴歸分析上的意義 3.迴歸分析的假設
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
課程九 迴歸與相關2.
邏輯迴歸 Logistic Regression
銳角三角函數的定義 授課老師:郭威廷.
Regression and Correlation
Chapter 3 Association: Contingency, Correlation, and Regression
Chapter 14 Simple Linear Regression
第 7 章 複迴歸之二.
數位化學習滿意度關鍵影響因素之研究 國立高雄師範大學 資訊教育研究所.
六年級數學科 體積與容量 的關係和單位 白田天主教小學下午校 趙國鴻.
Discriminant Analysis
相關與迴歸 Correlation and Regression
謝寶煖 台灣大學圖書資訊學系 量化研究與統計分析 迴歸分析 謝寶煖 台灣大學圖書資訊學系
線性相關與直線迴歸 基本概念 線性相關:兩個連續變項的共變關係,且有線性關係。所謂 的線性關係乃指兩個變項的關係可以被一條最具
第十一章 相關研究法.
第一章 直角坐標系 1-1 數系的發展.
虎克定律與簡諧運動 教師:鄒春旺 日期:2007/10/8
Linear Regression 一元线性回归分析.
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第 五 章 複迴歸分析.
第一章 直角坐標系 1-3 函數圖形.
Liner regression analysis
第 一 章 多元迴歸分析.
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
3-3 正、反比大挑戰.
大綱:加減法的化簡 乘除法的化簡 去括號法則 蘇奕君 台灣數位學習科技股份有限公司
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
圓的定義 在平面上,與一定點等距的所有點所形成的圖形稱為圓。定點稱為圓心,圓心至圓上任意一點的距離稱為半徑,「圓」指的是曲線部分的圖形,故圓心並不在圓上.
Is Statistics Difficult ?
上課大綱 迴歸係數的區間估計與假設檢定 統計顯著性與經濟顯著性 迴歸模型中的點預測與區間預測 配適度分析(變異數分析)
五年級數學科 體積與容量 的關係和單位 白田天主教小學下午校 趙國鴻.
第八章 銷售預測(2).
※歡迎挑戰,兩人(隊)中先完成連線即算過關!
Linear Regression Analysis 5E Montgomery, Peck & Vining
第一章 直角坐標系 1-3 函數及其圖形.
4-1 變數與函數 第4章 一次函數及其圖形.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
以下是一元一次方程式的有________________________________。
Presentation transcript:

本章重點: 1.迴歸分析及相關分析的意義及方法 2.利用最小平方法來估計迴歸方程式 3.相關分析與迴歸分析的關係 第七章 簡單相關與廻歸分析                        本章重點: 1.迴歸分析及相關分析的意義及方法 2.利用最小平方法來估計迴歸方程式 3.相關分析與迴歸分析的關係

係金ㄟ? 英國媽媽認為粉紅色助長公主病而抵制 很多女孩子喜歡粉紅色,一些玩具商為了賺小女孩的錢,也把許多玩具和飾品塗成粉紅色,不過英國有個媽媽,認為粉紅色會造成女孩子價值觀偏差,會得公主病,因此發起一項「反粉紅運動」,抵制粉紅色玩具。 據英國「每日電訊報」報導,這個媽媽說,玩具應該是要幫助小孩擴大想像力及創意的,不過實際上卻是強化性別觀念,所以一些給小女孩玩的東西,可以看到粉紅色玩具洗衣機,甚至還有粉紅色的地球儀,可說是走火入魔。 這個媽媽說,她希望她的女兒從遊戲中,真正學到活潑開朗的個性,而不是一個只懂打扮外表的公主(奇摩新聞網,2009/12/02)。

“關係”,有這麼嚴重嗎? 顏色與價值觀,有“關係”嗎? 在把這兩個綁在一起而認為有關係「之前」的「那個想法」,究竟是什麼? 如果有關係,為何粉紅色跟“公主”或“王子”又有關係? 如果以上兩者都“沒關係”,那怎麼成立“因果關係”?

在建立兩者因果之前,必須先有相關:相關分析(correlation analysis) 相關分析並未嘗試去定義自變數與依變數(即因果關係)。 相關程度:     r≥.80以上 非常高相關    r=.60-.80 高相關    r= .40-.60 中度相關    r=.20-.40 低弱相關     r≤.20 非常低相關

Ⅱ Ⅰ Ⅲ Ⅳ Ⅱ Ⅰ Ⅲ Ⅳ Ⅱ Ⅰ Ⅲ Ⅳ μy μy μy μχ μχ μχ (a) ρ> 0 正相關 (b) ρ< 0 負相關 (c) ρ= 0 無相關

象限 (χ-μχ) (y-μy) (χ-μχ) (y-μy) Ⅰ + Ⅱ - Ⅲ Ⅳ

正相關:落在第Ⅰ及Ⅲ象限的點數 > 落在第Ⅱ及Ⅳ象限的點數 負相關:落在第Ⅰ及Ⅲ象限的點數 < 落在第Ⅱ及Ⅳ象限的點數 無相關:落在第Ⅰ及Ⅲ象限的點數 = 落在第Ⅱ及Ⅳ象限的點數

相關係數 (Karl Pearson Coefficient) r= ∑ Zx.Zy / N = ∑xy/ NSxSy   →∑xy/N=共變數(covariance),是決定r大小的重要指標。  當∑xy/N = SxSy, r=1; 當∑xy/N=0, r=0

x y r = 1 x y r = -1 (a)完全正相關 (b)完全負相關

x y 0 < r < 1 x y -1 < r < 0 (a)不完全正相關 (b)不完全負相關

r = 0 r = 0 y y x x (a)無相關 (b)曲線關系

表一 某縣市高中生數學能力表現與大學數學能力表現之相關研究 (請求出兩者的相關係數)                表一    某縣市高中生數學能力表現與大學數學能力表現之相關研究 (請求出兩者的相關係數) 學生 高中數學成績(x) 大學數學成績(Y) χ у χ² у² χу A  74 84 B 76 80 C 90

相關係數的解釋 有相關並不一定有因果關係。 相關的意義與樣本大小有關,當樣本很小,雖得到很高的相關,但可能是機遇造成的。(例如若N=2,r=1的情形很大) 當分數的全距變小的時候,相關係數通常會變小(例如探討智商與學業成績的關係,若我們選擇的都是“高智商”學生,則兩者的相關變低)

簡單迴歸分析

簡單迴歸分析:迴歸分析的意義與方法 迴歸分析(Regression Analysis)是一種統計分析方法,它利用一組預測變數(或稱獨立變數)的數值,對某一準則變數(或稱應變數)做預測,它也可以做為評估預測變數對準則變數的影響程度。很不幸地,迴歸(Regression)的名字取得不理想,從字面上並不能表現出這種方法的重要性及其應用,取名實際上來自於1885年高登(Galton)所寫的論文“Regression Toward Mediocrity in Heredity Stature”。大致來說,其意義為:如果一些未知的獨立變數之影響程度消失,其應變異數應些一迴歸線。 迴歸分析是用來分析一個或一個以上自變數與依變數間的數量關係,以了解當自變數為某一水準或數量時,依變數反應的數量或水準。

迴歸分析的意義與方法 區分簡單迴歸分析(simple regression)與複回歸分析 (multiple regression)。前者為一個自變數與一個依變數。後者為二個或以上的自變數與一個依變數。 迴歸的主要目的是做預測,目標是發展一種能以一個或多個預測變數的數值來做為應變數預測的方法。本單元將探討“簡單”線性迴歸模式,也就是只用一個獨立變數x去預測應變數y的模式。

迴歸方程式建立的理由 當討論兩變數的資料時,我們會問兩個問題,第一個問題是這兩個變數間有無關係,如有關係,它的關係有多大(相關係數)。另一個問題是一變數對另一變數有何影響(迴歸分析)。迴歸的目的就是要找出變數間的關係式,即找函數f,使應變數y(Dependent Variable,或稱準則變數)與獨立變數x(Independent Variable或稱預測變數)間有: y=f(x)的關係式,最簡單的函數f是線性函數,即  f(x)=a+bx,我們稱這種線性關係式 , 我們稱之為簡單線性迴歸模式(Simple Linear Regression Model)

直線廻歸與預測 Y X 獨立變數 直線方程式:Ŷ=a+bx(透過x→y,Ŷ是y的預測值 ) 如何畫出迴歸線?採取最小平方法(The Method of Least Square,簡寫成LS) ,找出一條迴歸線使各點到此線的平行於Y軸的距離平方和最小。  ∑(Y-Ŷ)²=最小→  ∑(Y-a-bx)²=最小  b= ∑xy ∑x² 獨立變數 X Y

練習1: 有一項針對幼稚園教師的工作態度(x)及工作績效(y)的研究,若10名受試者在兩項變項的得分如下表。某研究人員透過迴歸分析,得到迴歸係數為0.66301,常數為17.00110,請根據此等資料回答下列問題: 1. 請建立此迴歸方程式 2. 此研究人員可根據迴歸方程式做何種工作? 3. 當某一教師的工作態度為88分,則他的工作績效為多少? 受試者 1 2 3 4 5 6 7 8 9 10 工作態度 95 82 90 81 99 93 87 工作績效 78 70 76 83 79 80 77

練習:5位學生的成就動機分數(x)學業分數(Y),利用表一演算的資料,回答下列問題: 1.  X與Y相關係數 2.. 由X預測Y的迴歸係數 b 3. 由x預測Y的截距 4. 由x預測y的迴歸預測方程式 5. SSt, SSreg, SSres各是多少? 學生 X Y Ŷ Y-Ỹ Y-Ŷ Ŷ-Ỹ A 11 12 B 10 9 C 6 D 5 7 E 3 ∑x=? ∑y=? ∑x² ∑y²

迴歸分析:決定係數(r²)的意義 觀念:我們在“總變異=被解釋變異+非被解釋變異”的公式中(SSt= SSreg+ SSres),或者我們在預測的工作中,最希望的是被解釋的變異要越多越好,也就是∑( Ŷ-Ỹ)² 要越多越好,而預測錯誤的部分越少越好,也就是  ∑(Y-Ŷ)²越少越好,如此預測才會越準確。 被解釋的變異佔整個總變異的百分比的比值,我們稱之為決定係數。換言之,這表示“在預測大學入學成績(Y)的總變異當中,究竟有多少的百分比是可以由高中入學成績(X)來預測的?” r²= SSreg / SSt(決定係數)(意思是:預測正確的部份佔平均數預測Y變項的誤差有多少?) 1-r²(疏離係數²),疏離係數=(1-r²)的開根號。

估計標準誤(Standard Error of Estimate)與 等分散性(homoscedasticity) 在上述的回歸分析中,我們相對的希望預測誤差的值越小越好∑(Y-Ŷ)²= min 。然而,我們每預測一次,就會形成一個誤差,預測N次,就會形成N個誤差.許多個誤差所形成分配中的標準差,我們稱之為“估計標準誤”(SEe)。換言之,我們關心這個誤差的“單位”是多少?我們將這個誤差的單位稱之為“估計標準誤”。      SY•X = √SSreg/N 在推論統計中,當Y變項成常態分配,X變項也成常態分配的時候,所預估的Ŷ也會成常態分配.不管預測變項的分數高或低,估計標準誤都是一樣大的時候,我們稱之為等分散性。

估計標準誤的特性 當r =±1的時候,表示預測變項Y都落在迴歸線上,預測完全沒有誤差。 當r=0的時候,表示使用Ỹ預測Y與Ŷ預測Y的誤差是一樣的,此時,使用迴歸線來預測完全無效。 當r的絕對值越大,估計標準誤越小,反之亦然。 

估計標準誤的實際應用 某研究者編製完成一份「學業性向測驗」,採用學業平均成績為效標(criterion).大量選取具有代表性的受試者之後,求得平均成績的標準差  ∂=5.49,效標關聯效度rxy= .87.以某學生學業性向測驗成績(X)代入預測公式,得到Ŷ= 83,問該學生學業成績的真正分數可能落在哪一個範圍?

練習 某校三年級學生智商的平均分數為104,標準差為15,數學的平均分數為74,標準差為8,且智商與數學的相關係數r=.60,試求: 以智商預測數學成績的迴歸方程式(Regression Equation) 此種預測的估計標準誤(SEe)為多少? 試求兩者的疏離係數?