当前位置:聪少自媒体网 > 微博 > 正文

微博博主特征与行为大数据挖掘.pdf 8页

2020-10-06 微博 聪少自媒体

专题 第?10?卷第?6?期2014?年?6?月

微博博主的特征与行为大数据挖掘

张华平 孙梦姝 张瑞琦 李 蕾

关键词 :社交网络用户 行为数据挖掘 北京理工大学

背景 户人格特征、价值观取向、自我 1700 万新浪微博具有真实身份的

认知状态以及社会需求等,带有 用户数据对 “微博生态系统”进

[2]

随着社交网络在互联网、移 强烈的个人色彩,反映了用户内 行深度分析 ,包括基本统计特

动互联网上的快速发展,社交网 在的心理状态。 征分析、数字化特征分析以及文

络用户的大量个人信息在互联网 在大数据应对的认识论与方 本特征分析,进而充分掌握新浪

上公开,原本碎片化的信息在大 法论方面,我们提出“知著、见微、 微博用户的各种宏观信息,据此

数据环境下被整合,并由此形成 [1] 构建了用户影响力模型,并对用

晓意”的论点 ,其中:知著是

了社交网络的大数据环境。针对 指从整体上来认识客观世界,快 户意图做了深入研究。

社交网络大数据的统计分析和数 速计算大数据的宏观特征与结 其次,针对用户的行为信息,

据挖掘方法成为了商业应用或科 构,是整体认识客观世界快速而 从微观层面入手,从社交网络用

学研究重要工具之一。与此同时, 又有效的方法 ;见微是指在宏观 户的行为 (原创微博、转发微博、

大数据的挖掘能力也威胁到了用 结构指导下,有针对性地研究有 关注微博用户、发表评论等)中

户的个人隐私保护。 代表性的微观数据,这里并不需 提取特定的行为模式[3] 。研究表

目前,按照隐私内容,社交 要对每一个微观都进行计算 ;晓 明,微博用户的群体行为表现出

网络的隐私及保护问题可分为三 意是指大数据语言内容的含义, 两段阶梯幂率分布的规律。但由

类 :一是用户基本属性、身份及 是语义的理解与认知,属于自然 于用户行为记录的不规律性与随

社会关系信息,包括真实姓名、 语言理解的范畴。本文将从 “知 意性,加上其受制于用户本人的

性别、年龄、所属机构、好友关 著、见微、晓意”这三个维度展 习惯、生活、学习或工作等客观

系以及社会影响力等,这些信息 现针对上述三类用户隐私的社交 因素,个体行为的研究目前还主

可以用来在现实生活中对社交网 网络大数据的挖掘工作,从隐私 要是限于写作风格和文本特征,

络用户进行定位。二是用户的行 挖掘的角度来看社交网络隐私的 对其中某个客观因素的研究,以

为属性,包括发帖、转发、评论 保护。 及简单的统计研究等。基于上述

关注的时间和频率等,反映了用 首先,针对用户的基本社会 问题,我们提出了行为矩阵模型,

户在现实生活中的作息规律、行 属性,采用面向用户群体的宏观 用于描述微博用户的行为活动,

为轨迹并进一步构成了用户的行 特征分析。在此,我们提出一种 并设计了行为矩阵分析法,这对

为特征。三是用户的精神特征属 “微博生态系统”,即一个包含微 加深对用户行为的理解,对于好

性,此类信息可通过用户言论的 博用户、用户发帖以及用户其他 友推荐、身份推理、群体分析以

潜在语义分析进行计算,包括用 活动行为的有机整体。我们结合 及精准营销等领域的研究和应用

36

第?10?卷第6?期2014?年?6?月

都有着深刻的意义。 转发树来研究用户影响力 ;文献 最后,从语义理解层面来

最后,我们针对用户的

聪少爱学堂聪少
聪少爱学堂创始人,梅州市鹏鑫网络科技有限公司CEO,09年开始踏入互联网,10年互联网行业经验,资深自媒体人,自媒体优秀导师,咪挺微商团对营销引流顾问,业务包含:精准引流技术/代引流精准粉,专业小红书,知乎,微博代运营。
  • 38988文章总数
  • 1491136访问次数
  • 建站天数
  • 合作伙伴