基于微博社交的人物关系可视化方法.pdf

发布时间:2025-05-22 01:26

《基于微博社交的人物关系可视化方法.pdf》由会员分享,可在线阅读,更多相关《基于微博社交的人物关系可视化方法.pdf(10页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010169044.2 (22)申请日 2020.03.12 (71)申请人 浙江工业大学 地址 310014 浙江省杭州市下城区潮王路 18号 (72)发明人 陈樟樟陈佳舟黄可妤秦绪佳 汪雨薇 (74)专利代理机构 杭州天正专利事务所有限公 司 33201 代理人 王兵黄美娟 (51)Int.Cl. G06F 16/9536(2019.01) G06F 16/951(2019.01) G06F 16/33(2019.01) G06Q 50/00(2012.01) G06F。

2、 40/289(2020.01) (54)发明名称 一种基于微博社交的人物关系可视化方法 (57)摘要 基于微博社交的人物关系可视化方法, 首 先,根据用户的微博ID爬取多名用户的用户信 息、 关注数据及微博文本; 其次, 对微博文本数据 进行预处理, 然后进行中文分词, 再运用隐含狄 利克雷分布(LatentDirichletAllocation, LDA)主题模型提取文本主题, 并分析微博文本相 似性; 然后, 通过解析用户关注数据、 微博文本数 据以及微博文本相似度, 构建社交关系网络; 最 后, 通过力导引布局、 打包布局等可视化方式展 示社交关系网络。 能够分析多个用户的微博数据 以。

3、解析用户间的社交关系, 并通过可视化的方式 展示社交关系网络。 权利要求书2页 说明书3页 附图4页 CN 111506824 A 2020.08.07 CN 111506824 A 1.基于微博社交的人物关系可视化方法, 包括以下步骤: 步骤1、 根据用户的微博ID爬取多名用户的用户信息、 关注数据及微博文本; 步骤2、 对微博文本数据进行预处理, 然后进行中文分词, 再运用隐含狄利克雷分布 (Latent Dirichlet Allocation, LDA)主题模型提取文本主题, 并分析微博文本相似性; 步骤3、 通过解析用户关注数据、 微博文本数据以及微博文本相似度, 构建社交关系网 络。

4、; 步骤4、 通过力导引布局、 打包布局等可视化方式展示社交关系网络。 2.如权利要求1所述的基于微博社交的人物关系可视化方法, 其特征在于: 所述步骤2 中, 首先对获取的微博文本数据进行清洗, 删除错误或重复的数据, 再使用基于TextRank方 法的 “结巴” (jieba)中文分词对微博文本进行分词, TextRank方法主要用于抽取关键词; 然 后将分词后的微博文本数据通过LDA挖掘出文本主题, 再通过增量Gibbs采样(Gibbs Sampling)算法计算微博文本主题在主题词上的概率分布, Gibbs采样是马尔可夫链蒙特卡 尔理论(MCMC)中用来获取一系列近似等于指定多维概率分。

5、布(比如2个或者多个随机变量 的联合概率分布)观察样本的算法; 最后, 使用Jensen-Shannon散数的倒数来衡量文本与文 本之间的主题相似度: 其中, vi, vj表示微博文本的主题概率分布, JS(vi|vj)表示vi, vj的Jensen-Shannon散 度, DKL(vi, vk)表示vi, vj的Kullback-Leibler散度。 3.如权利要求1所述的基于微博社交的人物关系可视化方法, 其特征在于: 所述步骤3 中, 根据用户关注数据, 对一个用户u, 假设其关注了n个用户, 表示为F(u1, u2, , un), 由u 和F组成的社交网络G可表示为有向图G(F, E)。

6、, 其中Eeij|uiF, ujF, ui关注uj, 表示 用户间关注关系的集合; 再根据微博文本, 如果ui转发了uj的一条微博或者微博中(提及) 他(她), 则认为两者之间有一条边, 为边设定权值, 权值大小为两者间的交互次数, 此时E就 可以表示为E eij|uiF, ujF, ui与uj产生了交互; 最后, 根据微博文本相似度, 若ui与 uj之间的文本相似度高于阈值, 则认为两者存在相似的爱好或价值取向, 两者之间有一条 边, 边的权值为两者的文本相似度, 这样E就可以表示为E eij|uiF, ujF, ui与uj存在 相似爱好。 4.如权利要求1所述的基于微博社交的人物关系可视化。

7、方法, 其特征在于: 所述步骤4 中, 通过节点链的力导引方式展示, 以节点表示用户, 边表示节点间的联系; 在节点链视图 中, 以节点的颜色表示用户的价值取向, 若节点的颜色越接近则表示用户的相似度越高, 以 权利要求书 1/2 页 2 CN 111506824 A 2 边的粗细表示用户间交往的次数多少, 越粗代表了用户间的交往越频繁; 通过打包图可视 化方法展示对象间共同关注信息; 用大圆包含识别对象的所有共同关注, 用中圆包含该对 象与其他任一对象的共同关注, 用小圆包括不同类别的共同关注。 权利要求书 2/2 页 3 CN 111506824 A 3 一种基于微博社交的人物关系可视化方。

8、法 技术领域 0001 本发明涉及一种利用计算机技术的微博社交人物关系分析方法, 能够分析多个 用户的微博数据以解析用户间的社交关系, 并通过可视 化的方式展示社交关系网络。 背景技术 0002 随着社交网络服务的盛行, 数以万计的用户每天活跃在社交网络 服务中, 在网络 上创造着丰富的信息, 由此构建了一个庞大而复杂多 样的虚拟社交网络。 在社交网络中, 发现社交关系是一个至关重要的 问题, 涉及到每一个人在社交网络中的自我定位和价值 发现。 因此, 通过分析人们在社交网络服务中的社交行为(发布博文、 转发、 关注), 挖掘社 交关系引起了许多学者的关注, 其中基于社交网络好友推荐拓 展社交。

9、关系颇受人们关注。 0003 目前针对社交网络好友推荐有两个主要研究方向: 基于用户兴趣 的主题推荐, 以 及基于社交网络拓扑结构的推荐。 第一个方向通过分 析用户在社交平台上的行为提取用 户兴趣爱好, 获得高相似度的用户 群, 在此基础上推荐好友给目标用户, 而用户的社交网 络拓扑结构很 大程度上反映了用户交友倾向, 彼此信任度越高的用户越有可能成为 朋 友, 但现有方法未充分利用这些因素。 因此, 亟需一种结合用户相 似度和信任度的好友推 荐方法, 进一步提高好友推荐的准确度, 使社 交关系的发现更加精准、 更具说服力, 并通过 可视化的方式展示, 使 结果更加直观。 发明内容 0004 。

10、本发明要克服现有技术中微博社交关系分析方法的准确性及直 观性不高的缺 点, 提供了一种利用计算机技术的微博社交人物关系分 析方法, 能够分析多个用户的微博 数据以解析用户间的社交关系, 并 通过可视化的方式展示社交关系网络。 0005 一种基于微博社交的人物关系可视化方法, 具体步骤如下: 0006 步骤1、 根据用户的微博ID爬取多名用户的用户信息、 关注数 据及微博文本。 0007 步骤2、 对微博文本数据进行预处理, 然后进行中文分词, 再运 用隐含狄利克雷分 布(LatentDirichletAllocation, 以下简称LDA)主 题模型提取文本主题, 并分析微博文本 相似性。 0。

11、008 步骤3、 通过解析用户关注数据、 微博文本数据以及微博文本相 似度, 构建社交关 系网络。 0009 步骤4、 通过力导引布局、 打包布局等可视化方式展示社交关系 网络。 0010 本发明的技术构思是: 利用爬虫技术, 获取用户的微博数据; 以 jieba分词和LDA 主题模型对微博文本数据进行处理; 根据微博文本、 关注数据、 用户相似度构建社交关系 网络; 利用力导引布局、 打包布 局等可视化方式展示社交关系网络, 提高社交关系提取的 准确性、 客 观性。 0011 本发明的优点在于: 通过计算用户微博文本相似性, 分析用户间 是否存在相似的 价值取向, 以获得高相似度的用户群, 。

12、通过解析用户 在社交平台上的交互行为(、 转发、 关 说明书 1/3 页 4 CN 111506824 A 4 注), 分析用户间的拓扑关 系, 以获得高信任度的用户群, 并利用有向图构建社交关系网络 并通 过可视化的方式展示, 使社交关系的发现更加准确、 客观, 具有说服 力。 附图说明 0012 图1为本发明的总的流程图。 0013 图2为本发明的力引导布局可视化效果图。 0014 图3为本发明的打包布局的共同关注可视化效果图。 0015 图4为本发明的打包布局的用户A关注可视化效果图。 0016 图5为本发明的打包布局的用户A与用户B共同关注可视化效 果图。 具体实施方式 0017 参照。

13、附图, 进一步说明本发明: 0018 基于微博社交的人物关系可视化方法, 包括以下步骤: 0019 步骤1、 根据用户的微博ID爬取多名用户的用户信息、 关注数 据及微博文本。 0020 步骤2、 对微博文本数据进行预处理, 然后进行中文分词, 再运 用隐含狄利克雷分 布(LatentDirichletAllocation, LDA)主题模型提 取文本主题, 并分析微博文本相似性。 0021 步骤3、 通过解析用户关注数据、 微博文本数据以及微博文本相 似度, 构建社交关 系网络。 0022 步骤4、 通过力导引布局、 打包布局等可视化方式展示社交关系 网络。 0023 所述步骤2中, 首先对。

14、获取的微博文本数据进行清洗, 删除错误 或重复的数据, 再 使用基于TextRank方法的 “结巴” (jieba)中文 分词对微博文本进行分词, TextRank方法主 要用于抽取关键词; 然 后将分词后的微博文本数据通过LDA挖掘出文本主题, 再通过增量 Gibbs采样(GibbsSampling)算法计算微博文本主题在主题词上的概 率分布, Gibbs采样是 马尔可夫链蒙特卡尔理论(MCMC)中用来获 取一系列近似等于指定多维概率分布(比如2个 或者多个随机变量的 联合概率分布)观察样本的算法; 最后, 使用Jensen-Shannon散数的 倒数来衡量文本与文本之间的主题相似度: 00。

15、24 0025 0026 0027 0028 其中, vi,vj表示微博文本的主题概率分布, sim(vi,vj) 表示, JS(vi, vj)表示vi,vj 的Jensen-Shannon散度, DKL(vi,vk)表示 vi,vj的Kullback-Leibler散度, zk表示, p(zk|vj) 表示。 说明书 2/3 页 5 CN 111506824 A 5 0029 所述步骤3中, 首先, 根据用户关注数据, 对一个用户u, 假设 其关注了n个用户, 表 示为一个用户集合F(u1,u2,un), 由u和 F组成的社交网络G可表示为有向图G(F,E), 其中Eeij|ui F,ujF。

16、,ui关注uj, 表示用户间关注关系的集合; 再根据微博文本, 如 果ui转发了uj的一条微博或者微博中(提及)他(她), 则可以 认为两者之间有一条边, 为边 设定权值, 权值大小为两者间的交互次 数, 此时E就可以表示为E eij|uiF,ujF,ui与 uj产生了交互; 最后, 根据微博文本相似度, 若ui与uj之间的文本相似度高于阈值, 则可 以认为两者存在相似的爱好或价值取向, 两者之间有一条边, 边 的权值为两者的文本相似 度, 这样E就可以表示为E eij|ui F,ujF,ui与uj存在相似爱好。 0030 所述步骤4中, 通过节点链的力导引方式展示, 以节点表示用户, 边表示。

17、节点间的 联系。 在节点链视图中, 以节点的颜色表示用户的价 值取向, 若节点的颜色越接近则表示 用户的相似度越高; 以边的粗细 表示用户间交往的次数多少, 越粗代表了用户间的交往越 频繁。 通过 打包图可视化方法展示对象间共同关注信息。 用大圆包含识别对象的 所有共 同关注, 用中圆包含该对象与其他任一对象的共同关注, 用小 圆包括不同类别的共同关 注。 0031 目前, 发现社交关系是社交网络中不可缺少的一个环节。 社交网 络好友推荐是发 现社交关系的重要途径。 社交网络好友推荐目前有两 个方向, 一是基于用户兴趣的主题推 荐, 二为基于社交网络拓扑结构 的推荐。 第一个方向通过分析用户在。

18、社交平台上的行为提 取用户兴趣 爱好, 获得高相似度的用户群, 在此基础上推荐好友给目标用户, 而 用户的社 交网络拓扑结构很大程度上反映了用户交友倾向, 彼此信任 度越高的用户越有可能成为 朋友, 但现有方法未充分利用这些因素。 本发明提出了一种结合用户相似度和信任度的好 友推荐方法, 进一步 提高好友推荐的准确度, 使社交关系的发现更加精准、 更具说服力, 并通过可视化的方式展示, 使结果更加直观。 0032 本说明书实施例所述的内容仅仅是对发明构思的实现形式的列 举, 本发明的保 护范围不应当被视为仅限于实施例所陈述的具体形式, 本发明的保护范围也及于本领域 技术人员根据本发明构思所能 够想到的等同技术手段。 说明书 3/3 页 6 CN 111506824 A 6 图1 说明书附图 1/4 页 7 CN 111506824 A 7 图2 说明书附图 2/4 页 8 CN 111506824 A 8 图3 图4 说明书附图 3/4 页 9 CN 111506824 A 9 图5 说明书附图 4/4 页 10 CN 111506824 A 10 。

网址:基于微博社交的人物关系可视化方法.pdf http://c.mxgxt.com/news/view/1353089

相关内容

可视化癌症基因关系显示方法和系统.pdf
基于微博用户行为的兴趣模型构建和可视化方法研究
社交网络数据个性化推荐的可视化方法.pdf
一种基于聚合矩阵的多层社交网络可视化方法及系统
基于和声搜索的社交网络多属性社区发现算法.PDF
在线社交网络传播动力过程及其可视化方法研究
人人网交流模式的社交网络分析与可视化实现
基于 G6 的可视化社交网络分析
基于社交影响力和标签关系的短视频标签生成
自动社交网络图挖掘和可视化.pdf

随便看看