Presentation is loading. Please wait.

Presentation is loading. Please wait.

第十三章 相關.

Similar presentations


Presentation on theme: "第十三章 相關."— Presentation transcript:

1 第十三章 相關

2 簡單相關係數CORREL() 所謂相關是指變項間相互發生之關聯,若僅是分析兩組資料間之相關, 我們稱簡單相關;若是分析多組資料間之相關,則稱之為複相關。 要瞭解簡單相關,通常有二種方式,一為繪製資料散佈圖(即Excel之 XY圖),另為計算簡單相關係數(亦即表示相關程度大小及正負之量 數)。 於Excel,計算簡單相關係數,可直接使用CORREL()函數,其語法為: CORREL(範圍1,範圍2) CORREL(array1,array2) 本函數用以計算兩組數字範圍之簡單相關係數,兩組數字範圍之資料 點必須相同。

3 簡單相關係數之計算公式為: 相關係數係一介於-1到+1之數字 其情況可有下列三種: =0 無關 >0 正相關 <0 負相關 當相關係數之絕對值達小於0.3時,為低度相關;絕對值介於0.3~0.7時,即為 中度相關;達0.7~0.8時,即為高度相關;若達0.8以上時,即為非常高度相關。

4

5 範例Ch13.xlsx『廣告費與銷售量』工作表,為一年度每月份之廣告費與銷售 量之數字;以
=CORREL(B2:B13,C2:C13) 可算出其相關係數為0.923,表銷售量與廣告費間存有極高度之正相關,銷售 量會隨廣告費遞增而明顯增加:

6 繪製資料散佈圖(XY散佈圖) XY散佈圖通常用以探討兩數值資料之相關情況,如:廣告費與銷售 量之關係、年齡與所得之關係、所得與購買能力之關係、每月所得與 信用分數之關係、……。 在X軸之資料稱為自變數;Y軸之資料稱為因變數;利用XY圖即可判 讀出:當X軸資料變動後,對Y軸資料之影響程度。如:隨廣告費逐 漸遞增,銷售量將如何變化? 繪製XY散佈圖時,所有數列資料均必需為數值性資料(圖例及標記 文字除外),若安排字串標記將被視為0,其所繪之圖形即無任何意 義。 假定,要依範例Ch13.xlsx『廣告費與銷售量』工作表之資料,來繪 製廣告費與銷售量之XY散佈圖,其執行步驟為: 選取B1:C13之連續範圍

7 切換到『插入』索引標籤『圖表』群組,選擇欲繪製『帶有資料標記的XY散 佈圖』 產生XY散佈圖,稍加移動其位置:

8 切換到『圖表工具/設計』索引標籤,點選『圖表版面配置』群組之『版面配 置1』
點選圖例『 』,按Delete將其刪除;分別點選圖表標題、X與Y 軸標題之文字方塊,輸入新內容『廣告費與銷售量之關係圖』、『廣告費』 與『銷售量』

9 以右鍵單按Y軸銷售量之數字,續選「座標軸格式(F)…」,轉入『座標軸格 式』之『刻度』標籤,將「最小值」改為1000(點選『最小值』處之「固定 (F)」,續於其後輸入1000)

10 按 鈕結束 以右鍵單按X軸廣告費之數字,續選「座標軸格式(F)…」,轉入『座標軸格 式』之『刻度』,將「最小值」改為100

11 按 鈕結束,獲致新XY散佈圖,可輕易看出銷售量會隨廣告費 遞增而明顯增加

12 馬上練習 以範例Ch13.xlsx『成績』工作表內容 計算其相關係數,並繪製國文及英文成績之XY圖,是否可看出國文成 績較高者,其英文成績也同樣會較高?

13 馬上練習 以範例Ch13.xlsx『學童』工作表內容 計算其相關係數,並繪製XY圖,查看學童之仰臥起坐與伏地挺身個數 之相關情況:

14 使用『資料分析』求相關矩陣 前例之CORREL()函數,僅能求算兩組資料間之相關係數。若使用 『資料分析』,還可計算出多組資料間之相關係數,組成一個相關係 數表。 範例Ch13.xlsx『汽車』工作表,收集到有關汽車鈑金、省油與價格 之滿意度資料: 擬以『資料分析』進行計算其相關係數表。其步驟為: 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分 析工具』處選選「相關係數」

15 續按 鈕 於『輸入範圍』處,設定兩組資料之範圍(本例為A3:C17) 將『分組方式』安排為「逐欄(C)」 點選「類別軸標記在第一列上(L)」(因各組資料均含標題之字串標記) 設定輸出範圍,本例安排於目前工作表之E3位置

16 按 鈕,結束 即可獲致多組資料之相關係數表(因為對稱矩陣,故顯示一半即可): 依此結果,顯示『鈑金與省油』及『鈑金與價格』之滿意度間均呈高度負相 關,對鈑金越滿意對其省油與價格將越不滿意。鈑金好的車身重量大,當然 較不省油,且其售價一般也比較高。另外,『省油與價格』之滿意度間則呈 高度正相關,因省油的車一般價位比較低之故。

17 馬上練習 以範例Ch13.xlsx『相關矩陣』工作表之內容: 求本班學生上學期之總平均成績、出席率、選修學分數與每週打工時 數間之相關係數表:

18 馬上練習 以範例Ch13.xlsx『數位相機』工作表: 求各屬性間之相關係數表:

19 母相關係數之檢定(小樣本) 由於,相關係數會受樣本數大小影響。於求得前面之相關係數後,我 們都會有一困惑,到底多大的相關係數,才可以說兩變數之間存有顯 著相關?

20 以rα檢定 若母體為常態分配,且母均數(μ1、μ2)與母變異數(σ12、σ22)均為 已知,於樣本數n≦30,母相關係數ρ之檢定是以自由度n-2之t分配進 行,其虛無假設與對立假設為: H0: ρ=0(無關) H1: ρ≠0(相關) 於求得樣本之相關係數(r)後,若 得棄卻虛無假設; 得接受虛無假設。

21 式中, 所使用之t值,是使用自由度n-2之t分配求得(雙尾)。
以範例Ch13.xlsx『檢定相關係數』工作表,於α=0.05、n=11、d.f.=9、所計 算之rα=0.6021>r=0.4848,故得接受母相關係數為0之虛無假設;也就是成績 與出席率之間無關:

22 馬上練習 以範例Ch13.xlsx『檢定相關矩陣』工作表之內容:

23 只要相關係數之絕對值>0.6021即表示兩者相關。可發現,選修學分與出席率存有顯著正相關,選修學分愈高者,通常較認真,其出席率也較高;每週工作時數與總平均成績間存有顯著負相關,打工時數愈多者,其成績會愈低。 以α=0.05,以先前所計算出rα=0.6021逐一配對檢定,利用 檢定相關矩陣內之變數,是否相互存有顯著相關?

24 以t檢定 另一種檢定方式為 H0: ρ=0(無關) H1: ρ≠0(相關) 於求得樣本之相關係數(r)及樣本數後,以
計算t值,然後查『附錄四 t方分配的臨界值』自由度n-2之tα/2(n-2) 值。當 即棄卻虛無假設。

25 前面,範例Ch13.xlsx『檢定相關係數』工作表之資料,其t值為 即E12之 =(E1*SQRT(E3))/SQRT((1-E1^2))
於α=0.05、d.f.=9、查『附錄四 t方分配的臨界值』自由度n-2之tα/2(n-2)值得到 2.262(也可直接以=TINV(雙尾機率,自由度)求得,即E5之=TINV(E4,E3)) 由於, t並未落入棄卻域,故也是得接受母相關係數為0之虛無假設,成績與出席率之 間無關。

26 當然,也可以將1.66及自由度9代入TDIST(t值,自由度,單尾或雙尾)函數,以 E13之 =TDIST(E12,E3,2) 求得P值為0.13>α=0.05,同樣可判斷出無法棄卻虛無假設:

27 如果,以範例Ch13.xlsx『成績與打工時數』工作表之資料,其t值為
即E7之 =(E2*SQRT(E4))/SQRT((1-E2^2)) 於α=0.05、d.f.=9、查『附錄四 t方分配的臨界值』自由度n-2之tα/2(n-2)值得到 2.262(即E6之=TINV(E4,E3)) 或由E8以 =TDIST(ABS(E7),E4,2) 因為t為負值故取其絕對值 計算之P值為0.01<α=0.05。均得判斷出應棄卻母相關係數為0之虛無假設, 亦即成績與打工時數間存有顯著之負相關:

28 母相關係數之檢定(大樣本) 若母體為常態分配,於樣本數n>30,母相關係數ρ之檢定是以標準常 態分配進行,其虛無假設與對立假設為:
H0: ρ=0(無關) H1: ρ≠0(相關) 於求得樣本之相關係數(r)後,若 得棄卻虛無假設;若 則無法棄卻虛無假設。

29 而此Zα/2值,可直接以 =NORMSINV(1-α/2) 求得。如α=0. 05,Zα/2值為1. 96:(詳範例Ch13
而此Zα/2值,可直接以 =NORMSINV(1-α/2) 求得。如α=0.05,Zα/2值為1.96:(詳範例Ch13.xlsx『Z值』工作表)

30 範例Ch13.xlsx『軟體x操控性』工作表,為消費者對數位相機『與電腦配合 執行的軟體』與『操控性(穩定度、速度等)』兩屬性之注重程度,於α=0.05、 Zα/2值為1.96、n=98、r=0.651代入 由所計算之 故得棄卻母相關係數為0之虛無假設;也就是數位相機之『與電腦配合執行的 軟體』與『操控性(穩定度、速度等)』兩屬性之注重程度間存有顯著相關:

31 馬上練習 範例Ch13.xlsx『清晰X速度』工作表之內容,為消費者對數位相機 『畫素色彩是否清晰』與『內建記憶體容量及速度』兩屬性之注重程 度: 求兩者之相關係數,並檢定其是否存有相關:

32 第十三章 結束 謝謝!


Download ppt "第十三章 相關."

Similar presentations


Ads by Google