第11期 电 子 学 报 Vol.46 No.11
2018年11月 ACTAELECTRONICASINICA Nov. 2018
融合标签平均划分距离和结构关系的
微博用户可重叠社区发现
1,2 1 3 1 1
马慧芳 ,陈海波 ,赵卫中 ,邴 睿 ,黄乐乐
(1西北师范大学计算机科学与工程学院,甘肃兰州730070;2桂林电子科技大学,广西可信软件重点实验室,广西桂林541004;
3.湘潭大学信息工程学院,湖南湘潭411105)
摘 要: 提出了一种融合标签平均划分距离和结构关系的微博用户可重叠社区发现算法.首先从信息论与距离
的概念出发,定义基于核心标签平均划分距离的准划分算法;再根据用户关注关系定义结构属性向量,并计算用户结构
相异度,进而对核心标签平均划分距离和用户结构相异度进行权重调节,得到综合划分相异度;最后将综合划分相异度
最低的标签所划分出的分组作为本次循环的新社区;实验表明,该方法能够识别可重叠社区且具有实际应用意义.
关键词: 可重叠划分;核心标签;平均划分距离;结构相异度;综合划分相异度
中图分类号: TP39309 文献标识码: A 文章编号: 03722112(2018)11261207
电子学报URL:http://www.ejournal.org.cn DOI:10.3969/j.issn.03722112.2018.11.007
LeveragingTagMeanPartitionDistanceandSocial
StructureforOverlappingMicroblogUserCommunityDetection
1,2 1 3 1 1
MAHuifang ,CHENHaibo,ZHAOWeizhong,BINGRui,HUANGLele
(1ComputerScienceandEngineering,NorthwestNormalUniversity,Lanzhou,Gansu730070,China;
2.GuangxiKeyLaboratoryofTrustedSoftware,GuilinUniversityofElectronicTechnology,Guilin,Guangxi541004,China
3CollegeofInformationEngineering,XiangtanUniversity,Xiangtan,Hunan411105,China)
Abstract: Inthispaper,amicroblogusercommunitydetectionalgorithmviatagmeanpartitiondistanceandsocial
structureisproposed.Firstly,throughtheconceptofinformationtheoryanddistance,acommunityprepartitionalgorithm
basedonthemeanpartitiondistanceofcoretagsisestablished.Furthermore,astructureattributevectorisdefinedaccord
ingtotheuser'sfollowingandfollowerrelationships,basedonwhichtheuserstructuredissimilarityiscalculated.Then,the
com