

臺大管理論叢
第
27
卷第
2S
期
7
參、意見探勘技術開發
為協助自社群媒體中大量的使用者產生資料裡,挖掘出有價值的顧客知識,本研
究提出以半監督式學習的方式,自動產生某一產品特徵的類別關聯規則,用以自未經
標註的使用者產生資料中,找出討論該特定產品特徵的句子。本研究的規則式意見句
子識別
(Rule-based Opinion Sentence Identification; R-OSI)
技術架構如圖
1
所示,主要
由產品特徵識別規則學習
(Product Feature Identification Rule Learning)
與意見句子識別
(Opinion Sentence Identification)
兩個階段組成。以下詳述此兩階段的設計細節,相關
變數的意義彙整如表
1
。
圖
1
規則式意見句子識別技術架構
產品特徵識別規則學習
(Product Feature Identification Rule Learning)
意見句子識別
(Opinion Sentence Identification)
網頁爬行
(Web Crawling)
前處理
(Preprocessing)
規則學習
(Rule Learning)
候選意見句子檢索
(Candidate Opinion
Sentence Retrieval)
網際網路
(www)
產品特徵
f
j
(Product Feature
f
j
)
社群媒體文集
(Social Media
Corpus)
產品特徵識別規則
(Product Feature
Identification Rules)
使用者產生資料
(User Generated
Content)
意見句子識別
(Opinion Sentence
Identification)
相關意見句子
(Relevant Opinion
Sentences)