服務庫存與營運績效關聯之實証研究:以台灣大車隊為例
70
行為模式,例如:
A
司機在某一個經緯度等待時間很長,一離開此經緯度後就承接乘
客,則可判斷
A
司機極可能是執行定點排班。演算成果進行輸出後,計程車司機的行
為模式可以用時間與空間兩個構面來加以描述,且成為時間與空間構面所展開的樣本
空間中的一個樣本點。
其次,在「統計分析」階段中為了能妥適地將類似行為模式的司機加以分類,本
研究使用
SPSS
統計分析軟體進行集群分析
(Cluster Analysis)
。集群分析是利用觀察值
之間的距離
(Distance)
或相似性
(Similarity)
資料進行分析,目的是將變項屬性相似程
度較高的觀察值加以分群,使集群與集群間的異質性達到最大,而同一集群內觀察值
同質性達到最高。本研究是使用兩階段式集群演算
(Two-stage Cluster) (Anderbeg,
1973)
,結合階層集群分析
(Hierarchical Cluster Analysis)
及非階層集群分析
(Non-
hierarchical Cluster Analysis)
兩種方法的演算過程
3
。首先,階層集群分析是使用「華
德法」
(Wards Method)
,又稱華德最小變異法;是以變異數分析方法來定義群間距離,
兩集群間之距離為兩集群原始資料之組間變異,為階層集群分析中最佳的分群法
(Punj
and Stewart, 1983)
。如以下公式,
A
、
B
兩群距離是以
A
群中心點 到兩群合併中心
點
X
距離平方乘以
A
的點數,與
B
中心點 到總中點的
X
距離平方乘以
B
的點數
之和。
(1)
為了確保階層集群分析的華德法所得到的適當集群數,能同樣地適用於
k-means
分析,本文根據
Hair et al. (2009)
建議以異質性改變的百分比
(Percentage Change in
Heterogeneity)
指標衡量,當群間距離增量突然變大的轉折點做為集群數決策依據。同
時,輔以侯勝宗
(2010)
作為理論基礎參考,以及研究者在產業中深耕的實務上經驗,
作為分群的依據。綜合整理理論、實務及指標上的各項資訊來決定合適的集群數進行
研究分析。
再者,非階層集群分析則是使用「
K-means
集群演算法」,由
MacQueen (1967)
所提出的集群演算法,其演算方法有利於處理觀察值的個數較多或資料非常龐大的演
算法。
K-means
分析法的演算邏輯是先任意選擇
K
個資料點做為集群的中心點。接著
3
主要的原因是若僅使用階層法集群分析,當二個個體被分配到同一個集群後,就會永遠在同一群
內。
Hair, Black, Babin, Anderson, and Tatham (2009)
建議結合階層與非階層集群方法的兩階段分群
方式 可以發揮兩種集群方法的優點,以避免單純使用
HAC
易受極端值
(Outlier)
影響的弱點。因
此,本研究首先進行階層集群分析,求得適當的集群數
K
後,再由非階層集群分析中
K-means
集
群演算法進行分析,以達到分群的最佳化之目的。