第 卷 第 期 中文信息学报 ,
26 1 Vol.26 No.1
年 月 ,
2012 1 JOURNALOF CHINESEINFORMATIONPROCESSING Jan.2012
文章编号: ( )
10030077201201007311
- - -
基于层次结构的多策略中文微博情感分析和特征抽取
1 2 1
, ,
谢丽星 周明 孙茂松
( ; ( ); , ;
智能技术与系统国家重点实验室 清华信息科学与技术国家实验室 筹 清华大学计算机系 北京
1. 100084
, )
微软亚洲研究院 北京
2. 100084
: , 。
摘 要 随着Web2.0 时代的兴起 与微博相关的研究得到了学术界和工业界的广泛关注 该文使用新浪 API获
, 。 ,
取数据 针对中文微博消息展开了情感分析方面的研究 我们对于三种情感分析的方法进行了深入研究 包括表
、 、 ,
情符号的规则方法 情感词典的规则方法 基于SVM 的层次结构的多策略方法 实验表明基于SVM 的层次结构多
。 , , 、
策略方法效果最好 其次 针对层次结构的多策略方法的特征选择进行了详细分析 包括主题无关 主题相关的特
。 。 ,
征 实验表明使用主题无关的特征时获得的准确率为 66.467% 引入主题相关的特征后 准确率提升至
67.283%。
: ; ;
关键词 新浪微博 情感分析 SVM
中图分类号: 文献标识码:
TP391 A
HierarchicalStructureBasedH bridA roachto
y pp
SentimentAnalsisofChineseMicroBlo andItsFeatureExtraction
y g