

多元迴歸的自變數比較與多元共線性之影響:效果量、優勢性與相對權數指標的估計與應用
80
Korabinski, 1984)
或一種正向綜效
(Synergism) (Shieh, 2001; Sharpe and Roberts, 1997;
Sharpe and Ali, 2009)
,也即符合
Horst (1941)
及
Conger (1974)
所定義的典型壓抑。由
圖
2
可知,增強效果可發生於兩種條件下,其中
R1
是指當
IV
間存在負相關時(亦即
交互壓抑),
R4
則是當
IV
存在高度正相關時。
至於
R3
則是指兩個
IV
之間的正相關所造成的迴歸係數擴張但
R
2
降低的壓抑效
果,此一現象可說是模式解釋力被「壓抑」的一種正名。最後,重疊效果
(R2)
雖不被
認為帶有壓抑效果
(Cohen et al., 2003; Tzelgov and Henik, 1991)
,但普遍常見於當
IV
具有相關時所可能會發生的迴歸係數降低而
R
2
也降低的共線性效果。
二、多元共線性的估計
至於如何判定共線性的強弱,若基於圖
2
的臨界值法則來看,隨著
IV
與
DV
的
相關強度的不同,會發生哪一種效果的臨界值並不相同。但一般而言,當自變數間的
相關達到
.85
以上即具有明顯的共線性威脅
(Dillon and Goldstein, 1984)
,更常用的判
定方式則是透過由容忍值
(Tolerance)
或變異數膨脹因素
(Variance Inflation Factor; VIF)
(Cohen et al., 2003; Pedhazur, 1997)
,如方程式
(27)
所示。
(27)
容忍值為各自變數
IV
自身作為
DV
,對自己以外的其他
IV
作迴歸後的迴歸殘差,
亦即
1–
R
i
2
,而
VIF
則為容忍值的倒數:當容忍值越高,
VIF
越小,表示
IV
的獨立性
越高,共線性問題越緩和。
Cohen et al. (2003)
認為當
VIF
大於
10
以上為嚴重共線性,
Sellin (1990)
主張
VIF
達
2
以上即不能忽略共線性威脅。
為探討多元共線性對於
IV
相對重要性指標的影響,本文將採
Friedman and Wall
(2005)
的定義方式,以模擬數據探討增強
(R1
與
R4)
、重疊
(R2)
、壓抑
(R3)
這三種典
型的共線性效果下,各種評估指標的表現。
肆、模擬數據分析
一、模擬分析的設定
為了說明效果量與各種指標的性質與關聯性,並檢驗
IV
之間不同型態的共線性
關係如何影響這些指標的估計結果,本節依照
Nimon and Oswald (2013)
的模擬方式,
建立
N = 1000
、
IV = 4
、
DV = 1
的
N (0,1)
標準常態分配模擬資料母體,進行重複拔靴
抽樣
1,000
次的模擬分析。分析工具為
R (R Development Core Team, 2014)
,以
yhat
模