臺大管理論叢第31卷第1期

13 NTU Management Review Vol. 31 No. 1 Apr. 2021 模型,將一段文字或文章進行分析,將結果量化為情緒分數 (Score)。情緒分數範圍 介於-1(極為負面)至1(極為正面),細分為0.25~1.0 為正面情緒,-0.25~0.25 為中立情緒,-1.0~-0.25 為負面情緒。本研究利用此工具分析用戶在TripAdvisor 發 表的評論,將每篇評論給予情緒分數,提供後續建立以顧客情緒分數為依據的預測 模型所用。 五、重要字詞篩選 本研究經資料預處理程序共得到470 個字詞,再使用特徵選擇技術 (Feature Selection) 篩選重要字詞,透過機器學習中的XGBoost 迴歸模型,統計字詞的「TFIDF值」與每篇評論「情緒分數」之間的相關性。XGBoost 全名為極限梯度提升技 術 (Extreme Gradient Boosting),可穩定處理大量數據並縮小損失函數值,藉由訓練 多個學習模型,找到最佳函數模型組合以最小化總體損失,並預測目標函數的結果。 根據預測值的類型,研究問題可分為迴歸和分類,而本研究預測目標函數為評論的 情緒分數,屬連續數據,故採用迴歸模型。 本研究以均方根對數誤差值 (RMSLE) 作為判斷模型預測準確度的指標。進行 迴歸模型分析後,XGBoost 模型的RMSLE值為0.18,小於一般線性迴歸的RMSLE 值為0.2。XGBoost 模型相對減少10%的誤差,其預測準確度高於一般線性迴歸, 最後依XGBoost 模型篩選出前65個與情緒分數相關的重要字詞。 六、航空服務品質面向分類 本研究依據Siering et al. (2018) 之研究,將航空服務面向分為三大主構面,分 別為「核心服務面向」、「延伸服務面向」與「其他面向」。「核心服務面向」次 構面包含:客艙設施與環境、座位舒適度、安全性、航班準時性;「延伸服務面向」 次構面包含:地勤服務、員工服務、機上餐點、機上娛樂、網路通訊;「其他面向」 次構面包含:物有所值與形象。本研究依據前述服務面向,將篩選後的重要字詞分 類至各類目。 肆、研究結果 本研究蒐集10 家廉價航空在TripAdvisor 旅遊網站的資料為樣本,共17,490 則 評論,詳細資料樣本如表2。在下載資料時,為了要讓各家航空公司所面對的市場 競爭狀況與評論者的狀態較為一致,因此設定了幾個條件:(1) 下載各家航空公司 資料的下載的時間設為一致;(2) 評論者留言的時間範圍一致;(3) 僅蒐集英文留言。 基於以上三個因素,造成各家航空公司蒐集到的樣本數不一。其中西南航空的規模 較大,英語留言量也較多,因此能下載的留言量也相對較大;亞洲航空X與歐洲

RkJQdWJsaXNoZXIy ODg3MDU=