臺大管理論叢
第
27
卷第
2S
期
17
因為上述的
Macro-F-measure
與
Micro-F-measure
值是
8
個產品特徵平均過後的結
果,無法看出不同產品特徵間是否存在差異,因此我們將
8
個產品特徵各別的表現與
Macro-F-measure
與
Micro-F-measure
的結果彙整在表
5
中。在
8
個產品特徵中,電池、
閃光燈、鏡頭、記憶體與螢幕等
5
個產品特徵的各別
F-measure
值高於
Macro-average
與
Micro-average F-measure
;而圖像、價格、視頻等
3
個產品特徵的各別
F-measure
值
則低於
Macro-average
與
Micro-average F-measure
。造成這些差異的主要原因是可用於
描述特定產品特徵的概念數量,尤其當隱性描述的數量多時,通常效果會比較差。以
圖像為例,除了易懂的
“Image,” “Picture,” “Quality,” “Resolution”
等關鍵字外,還有很
多未出現特定關鍵字的隱性描述,例如,
“Well, this is so sharp that I can’t imagine how
7 megapixels would be like.”
與
“Colors are vibrant.”
這兩個句子沒有出現常見的重要關
鍵字,因此不容易正確的識別為討論圖像產品特徵。
表
5 R-OSI
技術在
8
個產品特徵的各別表現
產品特徵
Precision
Recall
F-measure
電池
(Battery)
87.9%
96.2%
91.9%*
閃光燈
(Flash)
70.7%
91.9%
79.5%
圖像
(Image)
53.5%
35.1%
42.4%
鏡頭
(Lens)
86.8%
68.8%
76.8%
記憶體
(Memory)
73.9%
89.2%
80.8%
價格
(Price)
87.3%
43.5%
58.1%
螢幕
(Screen)
80.4%
92.4%
86.0%
視頻
(Video)
78.9%
61.7%
69.2%
Macro-Average
77.3%
72.4%
74.8%
Micro-Average
75.4%
61.9%
68.0%
*
:粗體表示各別產品特徵的
F-measure
值高於
Macro-
與
Micro-Average
。
緊接著,我們分析社群媒體文集大小對
R-OSI
技術的影響。表
6
為使用一個產品
特徵關鍵字的情況下,大文集與
RateItAll
、
Epinions
、
Amazon
等三個小文集對
R-OSI
技術的影響。可以發現,大文集與
Epinions
小文集在
Macro-F-measure
與
Micro-F-
measure
都有最佳的效能,兩個文集間僅有
0.1%
差異;其次為
RateItAll
小文集,
Macro-F-measure
與
Micro-F-measure
分別低
Epinions
小文集
1.1%
與
2.2%
;效果最差
的是
Amazon
小文集,
Macro-F-measure
與
Micro-F-measure
分別低
Epinions
小文集
1.2%
與
2.4%
。由上述結果可以發現,最佳的小文集與大文集的效果幾乎相等,都能讓
R-OSI
技術達到最佳的效能,但最佳的小文集需要經過實證評估才能找出,而大文集不需評
估即可直接採用,但在運算效率上會略低於小文集。