

多元迴歸的自變數比較與多元共線性之影響:效果量、優勢性與相對權數指標的估計與應用
78
標可概分成三類:適用於模式本身的整體解釋力或局部解釋的效果量、個別自變數的
效果量與相對重要性指標。這些統計量如果能夠建立抽樣分配,即可使用
NHST
進行
參數意義的統計顯著性檢定與區間估計,例如
R
2
可使用
F-test
,相關係數與迴歸係數
使用
t-test
。如果參數的抽樣分配不明確(例如一般優勢指數
D
g
與
RIW
數值),則必
須以拔靴法來建立信賴區間,同樣也可以進行區間估計。
值得注意的是,由於各指數所排列的
IV
優劣次序通常不一致,對於
IV
何者重要
的判斷必須訴諸主觀,因此經常造成研究者在比較與解釋上的困擾。後期學者則致力
於提出單一指標與客觀策略來進行相對重要性的判斷,然而許多學者仍主張乘積係數
是
IV
相對貢獻高低的主要指標(溫福星,
2013
;
Fields, 2003; Nimon and Oswald,
2013
),但近來學者則多主張以
DA
與
RWA
來取代。本文也即是針對相對重要性的
核心議題,亦即多元共線性的不同型態,進行探討。
參、多元共線性與壓抑效果
一、共線性的定義與效果分類
多元共線性
(Multicollinearity)
問題源自於迴歸分析當中所存在的壓抑效果
(Suppression Effect)
的關注。
Horst (1941)
最早發現,某個與
DV
無關的
IV
,會因為後
來投入的其他
IV
而發生整體效果量提升且係數放大的現象,因而將之定義為壓抑變
數
(Suppressor)
,因為後來投入的
IV
「壓抑」了殘差,使得原來的迴歸效果產生變化。
為了區分不同形式的係數變化關係,
Conger (1974)
進一步定義出三種不同形式的壓抑
效果:傳統壓抑
(Tradiational Suppression)
、負向壓抑
(Negative Suppression)
與交互壓
抑
(Reciprocal)
,對於這三個概念,
Cohen and Cohen (1975)
則稱之為典型壓抑
(Classical
Suppression)
、淨壓抑
(Net Suppression)
與合作壓抑
(Cooperative Suppression)
。其中傳
統/典型壓抑即是指
Horst (1941)
所發現的係數由不顯著成為顯著的現象,負向壓抑
則是指原本對於
DV
有正(負)相關的
IV
在迴歸模型中卻得到負(正)向迴歸係數
的逆轉現象
(Darlington, 1968)
。最後,交互/合作壓抑則是指兩個
IV
均與
DV
具有正
相關,但因為
IV
間存在的負相關而導致兩個
IV
的效果均提升的現象,相關較低者被
視為主要的壓抑變數。
Conger (1974)
與
Darlington (1968)
等學者對於壓抑效果的定義,皆關注於迴歸與
相關係數的比較,亦即 。其他學者(例如
Currie and Korabinski, 1984;
Hamilton, 1987; Schey, 1993; Sharpe and Roberts, 1997; Velicer, 1978
)則從模型解釋力的
增減來定義壓抑效果,亦即
R
2
>
,其中
r
Y1
與
r
Y2
為
IV1
及
IV2
與
DV
的零階
相關。
Friedman and Wall (2005)
整合兩者的概念,將壓抑效果再區分成增強
(Enhancement)
、壓抑
(Suppression)
與重疊
(Redundancy)
三種型態,並整合統計學者
(例如
Lynn, 2003; Neill, 1973; Shieh, 2001; Sharpe and Roberts, 1997
)的推導整理出三
者發生的條件,如圖
2
所示。