臺大管理論叢 NTU Management Review VOL.27 NO.2S

臺大管理論叢

第

卷第

期

子口碑

(Electronic Word-of-mouth)

，了解消費者對其產品的真正看法，進行產品設計

的改進或是新產品的開發；零售業者可以了解消費者的購物偏好，進行行銷智慧策略

的訂定，遂行各式精準行銷的工作，增加整體銷售業績；消費者則可以利用別人累積

的顧客知識，進行產品與服務的快速挑選，增加購物決策的效率與品質。此外，也可

以協助其他研究主題的進行，例如，提升商品銷售預測、意見領袖分析等應用的效能。

意見探勘的目的是分析人們對某些有興趣的實體（例如，產品、服務、組織、事

件等）的主觀看法（例如，意見、情感、評價等）

(Liu, 2010, 2012; Pang and Lee, 2008;

Feldman, 2013)

，並將這些資訊依據評論的對象（稱為產品特徵）與表達的主觀意見（稱

為意見傾向）適當地摘要彙整，專換成結構化的顧客知識。意見探勘主要由產品特徵

萃取（也稱為意見句子識別）與意見傾向判定兩個核心工作組成。產品特徵萃取的目

的是自使用者產生資料中萃取出使用者討論了哪些產品特徵，或是識別出那些句子有

討論特定的產品特徵；而意見傾向判定則是協助識別出使用者對前述的產品特徵或意

見句子的主觀意見傾向

(Hu and Liu, 2004a, 2004b; Popescu and Etzioni, 2005; Pang and

Lee, 2008; Yang, Wei, and Yang, 2009; Liu, 2010; Wei, Chen, Yang, and Yang, 2010)

。

本研究的重點為意見探勘中意見句子的識別，也就是當使用者表明對特定產品的

某個特徵（例如，汽車的引擎、旅館的餐飲等）有興趣時，自動從大量的使用者產生

資料中，找出有在討論該產品特徵的句子。傳統意見句子識別多採用監督式學習法來

進行

(Wong and Lam, 2005, 2008; Yang, Tang, Wong, and Wei, 2010)

，通常可以達到不錯

的識別效果，但是需要花費大量的人力與時間來準備監督式學習所需的訓練資料，且

訓練資料的品質通常顯著影響學習的結果。因此，本研究專注在提出一個半監督式的

學習法，用以減輕監督式學習法的大量人力與時間需求，同時希望不減低意見句子識

別的效果。本研究提出的方法稱為規則式意見句子識別

(Rule-based Opinion Sentence

Identification; R-OSI)

技術，其只需要使用者提供幾個關鍵字（例如，「鏡頭」、「光

圈」、「快門」）來描述有興趣的產品特徵（例如，相機的鏡頭），此外就是使用網

頁爬行器自社群媒體中抓取無須人工標註的使用者產生資料，進行類別關聯規則

(Class Association Rules)

的學習，達成意見句子識別的目的。本研究收集了真實的資

料，進行評估實驗，以了解本研究所提規則式意見句子識別技術的效能。結果顯示，

相較於使用監督式類別關聯規則演算法的技術，本研究

R-OSI

技術可以產出相似、甚

至更好的識別效果。

本文章的架構如下：第一章說明研究的相關背景、動機與目的；第二章摘要、簡

介意見探勘相關的文獻成果；第三章詳細介紹本研究所提規則式意見句子識別技術的

設計；第四章說明實驗評估的設計，並討論重要的實驗結果；最後，第五章彙整本研

究的重要結論與貢獻，並簡述未來的研究方向。