Gephi社会网络分析-网络图的过滤器(滤波)

2022-9-19 08:59| 发布者: Fuller| 查看: 6280| 评论: 0

摘要: 今天我们继续学习Gephi的过滤器(Filters),也就是对数据(网络节点和边)进行过滤操作,从而帮助分析人员能面对一个更美观更直观的网络图来进行探索和分析。在《用networkx和python编程可视化分析共现词关系图》这个Ju ...

在上一篇《Gephi社会网络分析-网络图的布局》中,我们使用Gephi自带的生成随机网络图的功能生成了随机网络,在此基础上学习和讨论了Gephi网络图布局的概念和功能操作。

今天我们继续学习Gephi的过滤器(Filters),也就是对数据(网络节点和边)进行过滤操作,从而帮助分析人员能面对一个更美观更直观的网络图来进行探索和分析。

在《用networkx和python编程可视化分析共现词关系图》这个Jupyter Notebook中,我们尝试过使用GooSeeker文本分词和情感分析软件生成的共词矩阵作为数据源,演练使用networkx画社会网络分析图。在接下来的其它几个notebook中又演练了对图的化简,分别根据边权重化简和利用MST算法化简。而GooSeeker分词和情感分析软件自带的图化简的方法只根据边的权重大小排序,保留用户设定的前n条边。可见,化简图的方法太少,那么,我们现在看看Gephi提供哪些化简方法。通过本文可以看到Gephi提供了大量的过滤器,以满足不同的社会网络图的分析需求。

今天我们将使用该Notebook相同的数据作为Gephi网络图的数据源,该数据是在知乎上采集“二舅”相关的话题,然后导入GooSeeker文本分词软件,经过选词后生成共词矩阵,以excel的形式导出。有关怎样在Gephi导入不同形式的数据,请参考这篇文章《Gephi社会网络分析数据的批量生成和导入》。

1 什么是Gephi的过滤器(Filters, 又名滤波)

过滤器(Filters)是通过用户设定的规则(包括正则表达式)对网络中的节点或边进行筛选,从而能够更精准地探索与分析网络。

在国内的不同文献中,我们会看到有的翻译成“滤波”,有的翻译成“过滤器”。如果作为动词的场合,则翻译成过滤。

过滤器(Filters)基本上可以当作一个查询工具使用,是图处理中一个非常有用的工具。过滤器(Filters)的操作过程大致可以分为以下4步。

(1)定义操作目的。

(2)选择合适的过滤规则。

(3)给选择的规则添加相应的参数。

(4)找到过滤后的节点。

下图是Gephi软件中显示的过滤器的分类:

2  Gephi过滤器(Filters)基本操作界面

基本操作界面如下图:

过滤有5类可以选择,每1类下面又有多个可组合选择的不同过滤器可以选择,篇幅所限,我们今天仅就其中的2个过滤器做解释和实验,其它的请大家直接查看官网的详细资料。

另外,为了能够针对“度”做过滤设置,需要在统计里点击运行“平均度”。关于统计的详细内容,我们会在下一篇详细学习:

2.1 动态

动态过滤是针对动态图的,在过滤的动态分类会有“Time Interval(时间间隔)”选项。

分析动态图的目的之一,是通过动态图在不同的时间段内结构的变化,发现规律或模式。动态过滤器(Dynamic)能够通过对范围和空值的约束,实现该目的。打开时间线,在时间线上进行拖曳,选择一个时间范围,同时过滤器中的“range”会根据选择的范围变化。这样在运行动态图时,可以以该范围为单位进行动态图播放。

2.2 属性

根据图节点或边的属性进行过滤。在属性分类中,可以使用的过滤器有7种,即分区、分区统计、等于、范围、边之间、边内部、非空,如下图所示:

分区

当一个图中的节点有统计数据后,在分区中可以根据对这些数据的分类,分别显示不同类的节点。

比如要显示一个图中所有入度为2的节点,也就是一个节点有两个边指向过来,如下图所示:

2.3 拓扑

根据图的拓扑结构进行过滤。在拓扑分类中包括9个选项,如下图所示:

度范围

度范围(Degree Range)是定义一个范围,筛选度(仅统计度数,不细分出度或入度)符合这个范围的节点。

2.4 操作-分类

逻辑过滤,可以将多个过滤器以某些逻辑关系结合在一起进行过滤。

2.5 边

根据边的特性进行过滤。

3 使用共词矩阵做“度”过滤实验

3.1 导入GooSeeker分词软件生成的共词矩阵excel文件

3.2 设置外观

3.3 设置布局

3.4 设置显示中文节点名称

注意:要能显示出中文标签名,需要选择特定的几种标签字体。下图选择了“宋体”:

3.5 基于度做过滤

做平均度统计后,基于度范围做节点过滤

4 总结

以上就是今天学习和实验的Gephi过滤相关的内容,和前面的外观和布局的学习不同,今天我们使用了从知乎上采集到的实际的社交媒体数据,经分词工具做分词和选词后生成共词矩阵,在Gephi中导入共词矩阵。

接下来我们将学习Gephi统计相关的内容。


鲜花

握手

雷人

路过

鸡蛋

最新评论

GMT+8, 2025-1-15 13:20