今天分享给大家的是一篇基于大数据驱动的社交网络舆情传播中网络谣言关系路径主题图谱可视化分析的案例,以新浪微博“重庆大巴坠江·非女司机逆行导致”话题为例,使用开源知识图谱工具Neo4j对数据进行主题图谱构建,利用Cypher语言对意见领袖的传播效率、传播路径和关键节点影响力进行分析。 前几天的那个案例:基于LDA模型的新冠疫情微博用户主题聚类图谱及主题传播路径研究,利用网络用户转发评论关系构建微博用户主题聚类图谱,提出网络社群间主题传播路径分析方法。 很多同学在看完该案例后,在Q群和论坛上和我们讨论了相关的问题,也提出了一些困惑。所以今天继续分享相关的案例,和大家一起学习提高。 研究所需的微博数据,可以使用集搜客的微博采集工具箱和微博快捷采集得到,添加网址或关键词启动采集即可。 1,研究论文简介 基金项目:国家社科基金重大项目“大数据驱动的社交网络舆情主题图谱构建及调控策略研究”(项目编号:18ZDA310)的研究成果; 作者:王晰巍1,2,3 张柳1 韦雅楠1 王铎1 1. 吉林大学管理学院 2. 吉林大学大数据管理研究中心 3. 吉林大学国家发展与安全研究院 关键词:社交网络舆情 网络谣言 主题图谱 意见领袖 关系路径 摘要: [目的/意义]大数据驱动的社交网络舆情传播中网络谣言关系路径主题图谱可视化分析,可以为相关舆情管理部门有效监管和正确引导社交网络舆情起到重要的指导和推动作用。 [方法/过程]文章采用网络爬虫对社交网络舆情传播中网络谣言话题进行数据获取,构建网络谣言基于意见领袖主题图谱的实体及用户关系,确定意见领袖的关系路径分析参数;以新浪微博"重庆大巴坠江·非女司机逆行导致"话题为例,使用开源知识图谱工具Neo4j对数据进行主题图谱构建,利用Cypher语言对意见领袖的传播效率、传播路径和关键节点影响力进行分析。 [结果/结论]数据结果表明,在微博网络谣言传播中,意见领袖知识图谱是一种有向网络关系图,意见领袖节点具有极强的影响力,普通用户节点的传播极易受到意见领袖节点的影响,意见领袖是舆情谣言话题传播中的关键人物;同时社交网络舆情的知识图谱整体呈现二级传播态势,单个意见领袖节点不具备左右谣言话题传播的能力,意见领袖节点与普通用户节点的壁垒随着网络谣言舆情的不断传播将在一定程度地慢慢弱化,使社交网络舆情向更为扁平及无序的方式传播。 2,研究理论与方法 2.1 主题图谱构建过程模型 本文构建了主题图谱构建过程模型,以说明社交网络舆情意见领袖主题图谱的实体及关系抽取过程及意见领袖主题图谱中的关系路径分析内容。 3,主要研究步骤 (1)需要进行话题数据的采集及清理,获取参与的社交网络舆情话题的转发、评论和点赞数据,以及网络用户信息; (2)将网络用户的昵称设定为实体,认证信息为属性,则转发、评论、点赞设定为实体与实体之间的关系; (3)基于认证信息构建意见领袖主题图谱分析的关系路径; (4)通过最短路径、平均路径长度,从节点传播广度上进行传播效率的分析; (5)通过中间中心度、接近中心度,从影响深度上进行社交网络“大V”的传播路径分析; (6)计算意见领袖的PageRank值,分析意见领袖在社交网络中的节点影响力。 4,讨论分析 4.1 微博谣言话题传播效率分析 微博谣言话题传播效率取决于用户节点间边的长度,通过最短路径与平均路径长度可从节点传播广度上对传播效率进行定量分析。 4.2 微博谣言话题传播路径分析 微博谣言话题的传播路径可通过中间中心度和接近中心度,对微博传播中网络谣言话题意见领袖节点处于中心地位的程度进行定量分析,从影响深度上找出微博谣言话题传播路径上的关键节点。 4.3 意见领袖节点影响力 意见领袖具有对其他普通网络用户的行为、思想或决定等产生影响的能力。在对微博谣言话题传播中意见领袖知识图谱进行节点影响力分析后,可以识别出影响力较高、较活跃的舆情传播的关键人物,通过对这些用户进行重点监管,可以正确引导网络舆情走向[27]。 5,研究结论 本文在理论层面,构建了社交网络舆情主题图谱过程模型,分析了社交网络舆情人物主题的实体及用户关系,分析了社交网络舆情意见领袖主题图谱关系路径中传播效率、传播路径和意见领袖节点影响力三个关键参数。实践层面,以网络谣言新浪微博“重庆大巴坠江·非女司机逆行导致”话题为例,使用Neo4j对网络谣言话题意见领袖关系路径进行主题图谱构建和分析,利用Cypher语言编程后对意见领袖关系路径中的传播效率、传播路径、意见领袖节点影响力进行分析。 研究发现,在微博网络谣言传播中,意见领袖知识图谱是一种有向网络关系图,意见领袖节点具有极强的影响力,普通用户节点的传播极易受到意见领袖节点的影响,意见领袖是舆情谣言话题传播中的关键人物;同时社交网络舆情的知识图谱整体呈现二级传播态势,单个意见领袖节点不具备左右谣言话题传播的能力,意见领袖节点与普通用户节点的壁垒随着网络谣言舆情的不断传播将在一定程度上慢慢弱化,使社交网络舆情事件以更为扁平及无序的方式传播。 |