Published on September 18, 2016September 18, 2016 ? 18 Likes ? 2 CommentsReport this post商务副总裁 - 壹见传媒182Share0
第0步:平台选择
考虑到品牌大小、预算多少、发展阶段等因素,其实不是所有的品牌都适合一上来就双微运营、编纂头部内容(最近不说这个词,感觉落后了时代)。起码苹果Apple就没有选择这样,Twitter帐号几起几落。以至于姗姗来迟的Apple Support Twitter帐号到来时,还一度成了新闻。
坦率来说,除了选择微博、微信等主流平台,也还是可以选择QQ空间、知乎、Lofter、QQ群等相对不常见的社交平台。特别对于新品牌,相对小众但是活跃度高、信任度高的社交平台,是发展种子用户的绝佳起点。
第1步:数据准备
微博可以公开售卖/爬取的数据集有:账户UID、微博内容、发帖时间、转发评论赞数量、转发评论内容(被微博去除水军后的)。
需要补充的数据集是——微博的相互关注关系数据,这部分数据可以通过购买获取。奈何这个数据集所费不菲、更新慢、数据性质为灰色,所以拥有这个数据不容易。以数据堂为例,截止到2014年2月3.5亿用户的关注数据售价为20万。
第2步:帐号质量度和影响力
有了第1步的数据准备,接下来重要的一个环节就是做帐号质量度的评估。
问题一:针对普通账户,如何区分出水军、僵尸粉,给到账户相应的质量度评分?
感谢林天逸(现在UC Berkeley 读数学PhD)不吝赐教,无须复杂的算法,而是兼顾运算量,通过普通的特征模型解决这个问题。稍做论文检索,就找到不错的解决方案。数学工程与先进计算国家重点实验室的解决方案参见参考文献2。在文章中里,通过以下21个维度来描绘了一个帐号的质量:
1.账户状态属性:粉丝数;关注数;互粉数;微博数;账户年龄;账户等级;声望值;互粉率;
2.历史微博属性:发布微博频率;原创微博比例;垃圾转发比例;微博平均被转发数;微博平均被评论数;
3.账户邻居属性:粉丝的平均粉丝数;粉丝的平均关注数;粉丝的平均互粉数;粉丝的平均声望值;关注好友的平均粉丝数;关注好友的平均关注数;关注好友的平均互粉数;关注好友的平均声望值。
这个解决方案的计算量也不小,不过相对是一个比较好的解决办法。有了这个办法,我们就获取到了每个帐号的质量度。
问题二:为什么不做活跃度?
因为社交媒体化,很多人只看不发、或者不互动。以目前可以获取到公开信息,做的活跃度评估更多是发帖行为表现;而炒作账户往往发布微博的频率高于正常账户。所以这个指标在现阶段,感觉参考价值有限。
问题三:如何衡量KOL?
依然刚才的质量度主要针对普通账户。针对KOL账户,首先第一步是定型,归属于联系员、内行、销售员三者之一;其次才是定量。
可以额外做的定量分析有:粉丝数*粉丝质量的加权、商业发帖的转评粉丝*质量加权/原始转发评论数、非商业发帖的转评粉丝*质量加权/原始转发评论数。
第3步:帐号内容
刚才分析的数据都是结构化数据,而帐号内容是一个宝库,奈何是非结构化数据,涉及到自然语言处理(中文NLP,多么蛋碎的话题)。
依然是北美好公司PeerIndex(目前已经被BrandWatch收购,关于BrandWatch,我们值得专门写一篇文章来描述这是一家多么好的公司),他们在处理帐号内容,做了以下一个很简单的产品。Topic fingerprint,简单直接,方便在找KOL时,大规模检索合适的KOL。
第4步:利用帐号连接关系挖掘社群和KOL
基于帐号内容、关注行为、互动行为,可以挖掘出在线群落以及群落里的意见领袖。
这部分参考文献5给了一个解决办法,受限制于数据量和数据集,目前的结果还需要更多数据来做支撑。但是这一定是一个寻找微博KOL的好办法。
番外:微博vs微信
在去年初,我会收到很多反馈——大致“微博已死、微信永生”这类腔调。作为一个因为不用微博、被老板怀疑脱离群众以至于1 on 1谈话过的吃瓜群众,却选择了坚定地支持微博。
彼时我不用微博,因为习惯了RSS订阅的我,清楚哪里才是互联网世界的优质内容聚集地。而去年我又开始拾起微博,原因是社交关系分成了弱关系和强关系。微信解决了强关系,而微博才是弱关系的主战场。
当然也感谢渣浪没有持续作死,从前年Q4开始做平台净化、去僵尸粉取水军,微博的重新活跃自然而然。当然加之直播的东风,一路把微博的股价炒到了百亿市值,几乎是新浪的两倍。
而接下来微博会怎样?
社交电商的故事还没有讲完,期待除了“网红女装股份注入”以外更多的玩法。
信息流广告产品距离Facebook还有鸿沟、阿里的DMP数据目测还没有注入(不过看阿里新的持股动作,可能有变),移动端广告还有很多想象空间。
好的,写了这么多,只是想说,AdMaster正式上线了KOL监测服务。在评估KOL有了6年项目经验后,我们终于把它系统化了。(猛戳https://kol.tuice.io/)肯定还有很多不足之处,欢迎多多贡献意见。
参考文献:
【1】关于苹果Twitter帐号,可以参看
《Why isn't @Apple on Twitter?》http://www.cnbc.com/2014/02/21/why-isnt-apple-on-twitter.html
《You Can Now Get Apple Support Through Twitterhttp://fortune.com/2016/03/03/apple-twitter-customer-service/》
【2】张进,刘琰,罗军勇,等. 基于特征分析的微博炒作账户识别方法[J]. 计算机工程, 2015,41(4):48-54,59.
【3】KOL效果评估四宗罪,http://alexwu.biz/2016/09/11/4-wrong-ways-of-kol-evaluation/
【4】PeerIndex,目前已被BrandWatch收购https://www.brandwatch.com/peerindex-and-brandwatch/
【5】曹玖新,陈高君,吴江林,刘波,周涛,胥帅,朱子青. 基于多维特征分析的社交网络意见领袖挖掘[J]. 电子学报, 2016(04).
商务副总裁 - 壹见传媒Follow2 commentsSign in to leave your commentShow more comments.