Table of Contents Table of Contents
Previous Page  7 /342 Next Page
Information
Show Menu
Previous Page 7 /342 Next Page
Page Background

臺大管理論叢

27

卷第

2S

7

參、意見探勘技術開發

為協助自社群媒體中大量的使用者產生資料裡,挖掘出有價值的顧客知識,本研

究提出以半監督式學習的方式,自動產生某一產品特徵的類別關聯規則,用以自未經

標註的使用者產生資料中,找出討論該特定產品特徵的句子。本研究的規則式意見句

子識別

(Rule-based Opinion Sentence Identification; R-OSI)

技術架構如圖

1

所示,主要

由產品特徵識別規則學習

(Product Feature Identification Rule Learning)

與意見句子識別

(Opinion Sentence Identification)

兩個階段組成。以下詳述此兩階段的設計細節,相關

變數的意義彙整如表

1

1

規則式意見句子識別技術架構

產品特徵識別規則學習

(Product Feature Identification Rule Learning)

意見句子識別

(Opinion Sentence Identification)

網頁爬行

(Web Crawling)

前處理

(Preprocessing)

規則學習

(Rule Learning)

候選意見句子檢索

(Candidate Opinion

Sentence Retrieval)

網際網路

(www)

產品特徵

f

j

(Product Feature

f

j

)

社群媒體文集

(Social Media

Corpus)

產品特徵識別規則

(Product Feature

Identification Rules)

使用者產生資料

(User Generated

Content)

意見句子識別

(Opinion Sentence

Identification)

相關意見句子

(Relevant Opinion

Sentences)