微博特定群体用户关系网络可视化

发布时间:2025-04-30 18:57
本篇可以说是给微博爬虫系列开了一个小方向,抓取微博特定用户的关注信息,并做了一定的可视化工作。下面以抓取明星关注为例,阐述从抓取数据,到关系网络的构造,最后使用 gephi 可视化的全流程。

第一步,以一个给定的明星 uid 为起点,爬取它的关注,接着爬关注的关注...从形式上看是一个递归的网络,所以设计了一个递归的爬虫,可以指定抓取指定的层数,断网或其他出错可以从上次爬到的地方继续;一般来说 3 层就非常多,以一个明星关注 100 个明星为例,第一层只有起点明星,第二层有 100 个明星,第三层就有 10000 个明星了,我使用杨幂的 uid 为起点,抓取 3 层网络,实测抓到了 2w+ 明星,20w+ 对明星关注关系,最后随机抽了 5000 条关注关系,2000 余明星。

第二步,根据上一步得到的数据构造关系矩阵,方便 gephi 可视化输入。这个关系矩阵需要两个 csv 文件表示,一个节点 nodes.csv 文件,另一个边表 edges.csv 文件。如下图所示。

节点表

边表

nodes.csv 四个字段,Id 即该明星的微博 UserId,Weight 是在关系网络中被关注的次数,class 是 louvain 聚类的结果。

edges.csv 三个字段,边的起点、终点、权重。

第三步,把数据导入 gephi,一顿点点点的操作后,可视化图形就出来了。

全景图

局部放大图

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。

原始发表:2021-10-11

,如有侵权请联系 [email protected] 删除

网址:微博特定群体用户关系网络可视化 http://c.mxgxt.com/news/view/905152

相关内容

微博特定群体用户关系网络可视化
网络可视化的消费者用户画像
不同社会化媒体圈群结构特征研究以新浪姚晨微博草根微博和人人网为例.pdf
微博名人关注网络的社会网络分析
微博2020用户发展报告:用户加速年轻化 代际特征明显
微博社交网络数据挖掘和用户权重分析.doc
微博用户粉丝演化模型的构建和实证
食品饮料用户微博数据深度解析 用户行为改变凸显社交媒体价值
微博APP用户体验大揭秘!
《微博》如何查找微博明星用户?

随便看看