臺大管理論叢
第
27
卷第
2S
期
3
子口碑
(Electronic Word-of-mouth)
,了解消費者對其產品的真正看法,進行產品設計
的改進或是新產品的開發;零售業者可以了解消費者的購物偏好,進行行銷智慧策略
的訂定,遂行各式精準行銷的工作,增加整體銷售業績;消費者則可以利用別人累積
的顧客知識,進行產品與服務的快速挑選,增加購物決策的效率與品質。此外,也可
以協助其他研究主題的進行,例如,提升商品銷售預測、意見領袖分析等應用的效能。
意見探勘的目的是分析人們對某些有興趣的實體(例如,產品、服務、組織、事
件等)的主觀看法(例如,意見、情感、評價等)
(Liu, 2010, 2012; Pang and Lee, 2008;
Feldman, 2013)
,並將這些資訊依據評論的對象(稱為產品特徵)與表達的主觀意見(稱
為意見傾向)適當地摘要彙整,專換成結構化的顧客知識。意見探勘主要由產品特徵
萃取(也稱為意見句子識別)與意見傾向判定兩個核心工作組成。產品特徵萃取的目
的是自使用者產生資料中萃取出使用者討論了哪些產品特徵,或是識別出那些句子有
討論特定的產品特徵;而意見傾向判定則是協助識別出使用者對前述的產品特徵或意
見句子的主觀意見傾向
(Hu and Liu, 2004a, 2004b; Popescu and Etzioni, 2005; Pang and
Lee, 2008; Yang, Wei, and Yang, 2009; Liu, 2010; Wei, Chen, Yang, and Yang, 2010)
。
本研究的重點為意見探勘中意見句子的識別,也就是當使用者表明對特定產品的
某個特徵(例如,汽車的引擎、旅館的餐飲等)有興趣時,自動從大量的使用者產生
資料中,找出有在討論該產品特徵的句子。傳統意見句子識別多採用監督式學習法來
進行
(Wong and Lam, 2005, 2008; Yang, Tang, Wong, and Wei, 2010)
,通常可以達到不錯
的識別效果,但是需要花費大量的人力與時間來準備監督式學習所需的訓練資料,且
訓練資料的品質通常顯著影響學習的結果。因此,本研究專注在提出一個半監督式的
學習法,用以減輕監督式學習法的大量人力與時間需求,同時希望不減低意見句子識
別的效果。本研究提出的方法稱為規則式意見句子識別
(Rule-based Opinion Sentence
Identification; R-OSI)
技術,其只需要使用者提供幾個關鍵字(例如,「鏡頭」、「光
圈」、「快門」)來描述有興趣的產品特徵(例如,相機的鏡頭),此外就是使用網
頁爬行器自社群媒體中抓取無須人工標註的使用者產生資料,進行類別關聯規則
(Class Association Rules)
的學習,達成意見句子識別的目的。本研究收集了真實的資
料,進行評估實驗,以了解本研究所提規則式意見句子識別技術的效能。結果顯示,
相較於使用監督式類別關聯規則演算法的技術,本研究
R-OSI
技術可以產出相似、甚
至更好的識別效果。
本文章的架構如下:第一章說明研究的相關背景、動機與目的;第二章摘要、簡
介意見探勘相關的文獻成果;第三章詳細介紹本研究所提規則式意見句子識別技術的
設計;第四章說明實驗評估的設計,並討論重要的實驗結果;最後,第五章彙整本研
究的重要結論與貢獻,並簡述未來的研究方向。