Table of Contents Table of Contents
Previous Page  4 /342 Next Page
Information
Show Menu
Previous Page 4 /342 Next Page
Page Background

社群媒體中顧客知識之挖掘:意見探勘技術開發

4

貳、文獻探討

意見探勘

(Opinion Mining)

,也稱為情感分析

(Sentiment Analysis)

,其目的是分析

人們對某些有興趣的實體(例如,產品、服務、組織、事件等)的主觀看法(例如,

意見、情感、評價等)

(Liu, 2010, 2012; Pang and Lee, 2008; Feldman, 2013)

,並將這些

資訊依據評論的對象(稱為產品特徵)與表達的主觀意見(稱為意見傾向)適當地摘

要彙整,專換成結構化的顧客知識,以協助企業更加了解廣大消費者的意見,並以之

發展重要的商業智慧應用,或提供一般使用者另一個訊息管道,避免被廠商官方資訊

誤導,做出更佳的消費決策。

“The battery life of this camera is

good

, but the price is

unacceptable

.”

這個句子為

例,我們知道該句子評論的兩個產品特徵為電池壽命

(Battery Life)

與價格

(Price)

,且

使用者的意見傾向分別為正向

(Good)

與負向

(Unacceptable)

。藉由對社群媒體上數量

龐大的使用者產生資料進行上述的情感分析,並進行適當彙整,可以協助使用者快速

瞭解社群媒體上人們感興趣的實體與主觀看法。為有效完成上述的分析與彙整工作,

意見探勘一般由兩個核心的工作組成,分別是

(1)

產品特徵萃取

(Product Feature

Extraction)

:也稱為意見句子識別

(Opinion Sentence Identification)

,目的是自使用者產

生資料中萃取出使用者討論了哪些產品特徵(開放式分析,沒有預設的產品特徵分析

對象),或是識別出那些句子有討論特定的產品特徵(聚焦式分析,已經訂好要分析

的產品特徵);

(2)

意見傾向判定

(Opinion Orientation Determination)

:判定使用者在

前述找出的產品特徵或意見句子上的意見傾向(例如,正向、負向、中性)

(Hu and

Liu, 2004a, 2004b; Popescu and Etzioni, 2005; Pang and Lee, 2008; Yang et al., 2009; Liu,

2010; Wei et al., 2010)

一、產品特徵擷取

產品特徵擷取技術大致上可分類成二個主要的方法:開放式

(Discovery-based)

聚焦式

(Focus-based) (Yang et al., 2009)

。開放式的產品特徵擷取技術並沒有預定要分

析的產品特徵對象,聚焦式的產品特徵擷取技術需事先給定要分析的產品特徵對象。

開放式方法一般不需要準備訓練樣本,因此也可以稱為非監督式方法。例如,

Hu

and Liu (2004a, 2004b)

發展的技術,假設產品特徵必須是名詞或名詞片語,並採用關

聯規則探勘演算法

(Agrawal and Srikant, 1994; Srikant and Agrawal, 1995)

來擷取在特定

的一個顧客評論集中的所有產品特徵。

Wei et al. (2010)

延續

Hu and Liu (2004a, 2004b)

的研究,加入一組正向和負向情感字詞

(Semantic Words)

和三個啟發式規則

(Heuristic

Rules)

,以提高產品特徵擷取的效能。除了關聯規則探勘之外,資訊擷取

(Information

Extraction)

技術提供了另一種可行解決方案,例如,

Popescu and Etzioni (2005)

採用一

個名為

KnowItAll (Etzioni, Cafarella, Downey, Popescu, Shaked, Soderland, Weld, and