Table of Contents Table of Contents
Previous Page  3 /342 Next Page
Information
Show Menu
Previous Page 3 /342 Next Page
Page Background

臺大管理論叢

27

卷第

2S

3

子口碑

(Electronic Word-of-mouth)

,了解消費者對其產品的真正看法,進行產品設計

的改進或是新產品的開發;零售業者可以了解消費者的購物偏好,進行行銷智慧策略

的訂定,遂行各式精準行銷的工作,增加整體銷售業績;消費者則可以利用別人累積

的顧客知識,進行產品與服務的快速挑選,增加購物決策的效率與品質。此外,也可

以協助其他研究主題的進行,例如,提升商品銷售預測、意見領袖分析等應用的效能。

意見探勘的目的是分析人們對某些有興趣的實體(例如,產品、服務、組織、事

件等)的主觀看法(例如,意見、情感、評價等)

(Liu, 2010, 2012; Pang and Lee, 2008;

Feldman, 2013)

,並將這些資訊依據評論的對象(稱為產品特徵)與表達的主觀意見(稱

為意見傾向)適當地摘要彙整,專換成結構化的顧客知識。意見探勘主要由產品特徵

萃取(也稱為意見句子識別)與意見傾向判定兩個核心工作組成。產品特徵萃取的目

的是自使用者產生資料中萃取出使用者討論了哪些產品特徵,或是識別出那些句子有

討論特定的產品特徵;而意見傾向判定則是協助識別出使用者對前述的產品特徵或意

見句子的主觀意見傾向

(Hu and Liu, 2004a, 2004b; Popescu and Etzioni, 2005; Pang and

Lee, 2008; Yang, Wei, and Yang, 2009; Liu, 2010; Wei, Chen, Yang, and Yang, 2010)

本研究的重點為意見探勘中意見句子的識別,也就是當使用者表明對特定產品的

某個特徵(例如,汽車的引擎、旅館的餐飲等)有興趣時,自動從大量的使用者產生

資料中,找出有在討論該產品特徵的句子。傳統意見句子識別多採用監督式學習法來

進行

(Wong and Lam, 2005, 2008; Yang, Tang, Wong, and Wei, 2010)

,通常可以達到不錯

的識別效果,但是需要花費大量的人力與時間來準備監督式學習所需的訓練資料,且

訓練資料的品質通常顯著影響學習的結果。因此,本研究專注在提出一個半監督式的

學習法,用以減輕監督式學習法的大量人力與時間需求,同時希望不減低意見句子識

別的效果。本研究提出的方法稱為規則式意見句子識別

(Rule-based Opinion Sentence

Identification; R-OSI)

技術,其只需要使用者提供幾個關鍵字(例如,「鏡頭」、「光

圈」、「快門」)來描述有興趣的產品特徵(例如,相機的鏡頭),此外就是使用網

頁爬行器自社群媒體中抓取無須人工標註的使用者產生資料,進行類別關聯規則

(Class Association Rules)

的學習,達成意見句子識別的目的。本研究收集了真實的資

料,進行評估實驗,以了解本研究所提規則式意見句子識別技術的效能。結果顯示,

相較於使用監督式類別關聯規則演算法的技術,本研究

R-OSI

技術可以產出相似、甚

至更好的識別效果。

本文章的架構如下:第一章說明研究的相關背景、動機與目的;第二章摘要、簡

介意見探勘相關的文獻成果;第三章詳細介紹本研究所提規則式意見句子識別技術的

設計;第四章說明實驗評估的設計,並討論重要的實驗結果;最後,第五章彙整本研

究的重要結論與貢獻,並簡述未來的研究方向。