Canonical Correlation Analysis 正典相關分析只能衡量兩組變數間之相關程度,無法討論其間之因果關係。 行銷研究 實務上,整體性的廣告策略包括六個主要的決 策,如廣告目標、目標群眾、廣告表現、訴求重 點、廣告媒體、廣告預算等。其中,除了廣告目 標與廣告預算策略之外,其他策略皆可應用多變 量統計方法進行分析。
典型相關分析 單變項複相關: 典型相關分析: 有p個X變項和一個Y變項,分析的目的在於找出適當的迴歸係數作為這p個X變項的加權值,使p個X變項之線性組合分數與這一個Y變項分數之間的相關變為最大。 典型相關分析: 也有p個X變項,但是Y變項卻有q個(q>1)。典型相關的目的在於找出這p個X變項的加權值和這q個Y變項權值,使這p個X變項之線性組合與這q個Y變項之線性組合的相關達到最大值。
廣告訴求策略(Appeal Strategy)可運用正典相關 分析,探討那些廣告訴求可以有效刺激顧客之產 品需求。 購買決策過程 理論上,顧客在接受不同訴求重點之廣告刺激 後,對產品本身會產生某種認知或態度,進而產 生不同程度之產品需求。
其中,廣告刺激→產品認知/態度→產品需求, 即形成一種購買決策過程。為探討何種廣告訴求 (如消費情境)可以成功引發消費之產品需求 (如產品強度),行銷研究人員可藉由正典相關 分析衡量二組變數間之關係強度。
方法說明 1.一般型態 Y1B1 + Y2B2 + Y3B3 +...YnBn 2.目的 = A0 + X1A1 + X2A2 + X3A3 +...XnAn 2.目的 決定兩組變數(對相同事物的衡量)是否彼此獨立,或決定這兩組變數間之關係強度。 為每一個準則和預測變數組導出一組權重,俾使它們的線性結合的相關為最大。而另外能使剩下的相關為最大的線性函數與前面的線性結合是相互獨立的。 從每個變數對典型函數(canonical function)的相對貢獻度來解釋準則變數組和預測變數組二者間之關係的本質。
3. 4.正典相關分析必須符合一些基本的統計假定, 包括直線性、常態性、變異數相等性和無複共 線性。
處理流程
理論探討 1.正典相關係數 假設預測變數X有m1個變數,準則變數Y 有m2個變數,則這兩組變數共有m=m1+m2個變數。如果將這m 個變數中每一個變數彼此間的相關係數求出,可得一個正方形的、相對稱的相關矩陣R;矩陣R可劃分成四部分:
2.顯著性檢定 正典相關統計顯著性檢定的虛無假設如下: H0:R1=R2=…=Rm2=0 (m1代表預測變數的數目,m2代表準則變數的數目,為便於說明,假設m2≦m1) 為檢定正典相關的顯著性,可以(1)利用巴氏(M. S. Bartlett)的V統計值來進行卡方檢定,或(2)以Roa的近似值進行F檢定。不論是F檢定或卡方檢定,結論都一樣。以下將說明利用V統計值進行卡方檢定的過程。
V統計值大致呈卡方分配(X2,自由度=m1m2)。 在檢定第一對典型關係(即第一個典型函數)時,先求Wilk’s Λ(lambda)值: Λ=π(1-λj) (j=1,2,…,m2) 巴氏的V統計值為: V=-[n-1.5-(m1+m2)/2]InΛ (n:樣本總數) V統計值大致呈卡方分配(X2,自由度=m1m2)。 如果拒絕虛無假設(H0:兩組變數X與Y的線性結合沒有相關),則可剔除第一對典型關係對Λ的貢獻,然後繼續檢定其餘的典型關係。
假說檢定流程
3.重疊指數(The Stewart-Love index of redundancy) 重疊指數係計算一組變數中的變異數能夠由另一組變數的典型變量解釋的比例,它可由兩個數字相乘而得:一是準則(或預測)變數組的典型變量能解釋該組變數之變異數的比例,一是準則(或預測)變數組之典型變量的變異數能夠被預測(或準則)變數組的典型變量解釋的比例。 要求得典型變量所解釋之共有變異數的比例,首先要計算預測和準則兩組變數之典型變量(Uji和Vji)和各自的原始變數間的簡單線性相關。這些線性關係稱之為「典型結構相關」(canonical structure correlation),一般亦通稱為「典型負荷量」。
預測變數的典型結構相關或典型負荷量(S1)為: S1=1/nΣXiUi=1/nΣXi(b'Xi)=1/nΣXiXi'b=Rxxb (i=1,2,…,n) 準則變數的典型結構相關或典型負荷量(S2)為: S2=1/nΣYiVi=Ryya 典型負荷量代表每一個原始變數和它自己的典型變量之間的相關;將每個變數的典型負荷量予以平方,就可獲得每一個原始變數的變異數被其典型變量解釋的比例。各變數的典型負荷量平方值的簡單平均數就是典型變量所解釋之共有的變異數的比例。
典型相關係數的平方(R2=λj)代表二個典型變量U和V之間共有的變異數;亦即R2代表U(或V)的變異數能夠由V(或U)解釋的比例。R2是預測變數的典型變量和準則變數的典型變量之間相關係數的平方,通稱為「典型R2」(canonical R2)。 重疊指數係一組變數的典型變量能解釋該組變數共有的變異數的比例與這組變數的典型變量的變異數能夠被另一組變數的典型變量所解釋的比例二者的乘積。
重疊指數的計算是重要的。典型相關的平方(典型R2)雖是衡量兩個典型變量間共有的變異數,但可能導致一些誤解,因為它代表的是兩組變數的線性結合(典型變量)所共有的變異數,而不是兩組變數所共有的變異數。即使這些線性結合(典型變量)所能解釋的各該組變數之變異數的比例並不大,也有可能會得出一個較強的典型相關。
4.典型函數的解釋 哪些典型函數應予解釋? 顯著性水準 一般認為0.05水準是典型相關最低要求的顯著水準,0.05水準和0.01水準是一般可接受的水準。 典型相關 典型相關的大小代表典型函數在實務上的重要性,因此也應加以考慮。典型相關要多大才可以接受並無可被共同接受的標準可循,通常係視研究發現對增進研究問題了解的貢獻如何而定。
重疊指數 重疊指數要多大才可去解釋典型函數,和典型相關一樣,也沒有可被共同接受的標準可循。研究人員必須依照各個典型函數在理論上與實務上對研究問題的重要性來決定重疊指數是否夠大。
如何解釋典型函數? 典型函數的解釋主要是要了解每一個原始變數在典型關係中的相對重要性,其方法有三種:(1)典型權重,亦即標準化的典型係數;(2)典型負荷量;(3)典型交叉負荷量(canonical cross-loadings)。 典型權重 傳統上係以每一個變數在其典型變量中之典型權重的正負號和大小來解釋典型函數。權重較大的變數對典型變量的貢獻也較大,反之亦然。
典型負荷量 典型負荷量,亦稱「典型結構相關」,係衡量準則或預測變數組中一個原始的觀察變數和該組的典型變量間的簡單線性相關。這種方法分別考量每一個獨立的典型函數,並計算組內變數和變量的相關;亦即,對每一個變數組(預測變數組和準則變數組),它計算每一個原始的觀察變數和其各自的典型變量間的相關。典型負荷量代表觀察之變數與典型變量共同擁有的變異數,在評估各個變數對各典型函數的相對貢獻大小時它的意義就像是因素負荷量(factor loading)。
典型交叉負荷量 傳統的負荷量是在兩個典型變量(準則和預測)彼此間有最大相關之後計算原始的觀察變數和其各自的典型變量間的相關;而交叉負荷量是指每一個原始的準則(或預測)變數直接和預測(或準則)變數組之典型變量間的相關。交叉負荷量消除了在計算傳統負荷量時的一個中間步驟,因此可更直接地衡量準則-預測變數的關係。