Gephi[1]是一款网络分析领域的数据可视化软件,目标是成为“数据可视化领域的Photoshop”。其前身是由法国巴黎政治学院教师mathieu jacomy于2006年开发的graphiltre,2007年正式更名为gephi 0.5发布[2],目前最新版本为0.92[3]。
目录
一、Gephi主要功能介绍
(一)相关背景
(二)主要功能模块
二、Gephi数据输入方式
三、页面操作介绍
(一)概览界面
(二)数据界面
(三)预览界面
参考教程
(一)书籍
1、网络数据可视化与分析利器:Gephi 中文教程(刘勇/杜一,电子工业出版社)
(二)教程
1、gephi中文教程:https://www.udemy.com/gephi/
2、github:https://github.com/gephi/gephi/wiki
3、官方教程:https://gephi.org/users/
一、Gephi主要功能介绍
(一)相关背景
(二)主要功能模块
二、Gephi数据输入方式
(一)Spreadsheet
1、教程:Spreadsheet (Excel)
2、需要节点数据文件(可选)+边数据文件(必选),其中节点数据可定义节点ID/label/time interval等,边数据可定义边ID/label/type/weight/time interval等。
3、入口:
(1)file — import spreadsheet
(2)data laboratory——import spreadsheet
4、示例:
(二)CSV
1、教程:CSV Format
2、入口:file — open
3、支持类型:Edge List/Adjacency List/Mixed/Matrix
(1)Edge List
(2)Adjacency List
(3)Mixed
(4)Matrix
(三)EXCEL文件(不支持有向,可用于生成共现数据)
1、入口:file — import
2、类型:同字段共现;字段间共现;同字段+不同字段间共现
(1)同字段共现:agency中选择相同字段;option中选择creat links between ID agency (建立字段内的联系)
(2)字段间共现:agency中选择不同字段;option中不要选择creat links between ID agency (不建立字段内的联系)
(3)同字段+不同字段间共现:agency中选择不同字段;option中选择creat links between ID agency (建立字段内的联系)
(四)GEXF文件
1、教程:GEXF File Format
2、入口:file — open
3、示例:定义两个节点一条边
<?xml version="1.0" encoding="UTF-8"?>
<gexf xmlns="http://www.gexf.net/1.2draft" version="1.2">
<meta lastmodifieddate="2009-03-20">
<creator>Gexf.net</creator>
<description>A hello world! file</description>
</meta>
<graph mode="static" defaultedgetype="directed">
<nodes>
<node id="0" label="Hello" />
<node id="1" label="Word" />
</nodes>
<edges>
<edge id="0" source="0" target="1" />
</edges>
</graph>
</gexf>
(五)特定图形文件格式:Supported Graph Formats
* GEXF
* GDF
* GML
* GraphML
* Pajek NET
* GraphViz DOT
* UCINET DL
* Tulip TPL
* Netdraw
(六)其他
1、鼠标添加:画点和画线按钮
2、键盘输入:data laboratory — add node/edge
3、自动生成(用于练习):file — generate
4、从数据库中直接读取:Import — database
5、生成点击网页的网络关系
三、页面操作介绍
Gephi共包括三个主要页面:概览(图处理,可视化编辑的主要界面);数据资料(分为节点数据和连线数据,在数据表上方和下方是用于数据处理的工具);预览(预览输出,图形处理完成后,可以在此输出)。
概览界面
(一)图窗体:图形编辑和显示
1、操作节点和连线的工具(左侧)
(1)鼠标选取范围尺寸调整:如果将鼠标移动到某一节点上,与这个节点组成边的其他节点就会显示,从而了解该节点的关联状态。单击configure按钮,可以设置鼠标选取的范围,即同时选择一组节点,并且显示这组节点相关联的其他节点。
(2)单选:单独选择一个节点,右击进行操作。
(3)矩形选取:在一个矩形范围内选取一组节点。
(4)移动:按左键拖动节点、按右键拖动图像、华东鼠标滑轮放大或缩小整个图形。
(5)单节点涂色:单击次数越多,节点颜色越深。在矩形范围内会给多个节点涂色。
(6)节点大小调整:按住鼠标左键上下拖动
(7)关联节点涂色:颜色、颜色强度、扩散模式
(8)新建节点:颜色、直径
(8)新建边:边的类型和权重
(9)节点距离:判断两个节点之间是否存在路径,如果存在就把最短路径用选中的颜色表示出来。
(10)节点范围:以一个节点为起点,根据距离的远近,给不同距离的节点涂上不同的颜色,在涂色中,也会引入权重的参数,在涂色之前需要配置涂色的模式和色彩,其中,涂色的模式分为梯度grandient和调色板palette。
(11)节点属性:节点属性是节点基础数据和统计数据的查看和编辑工具,分为Properties(属性)数据和Attributes(特性)数据。Properties(属性)可以理解为节点天生的、固有的数据,包括尺寸、位置(X/Y/Z)、颜色、标签大小、标签颜色;Attributes(特性)数据可理解为抽象化、动态变更的数据,包括ID、标签、间隔,Attributes(特性)数据可以根据节点数据的增加而扩充。
2、编辑标签和控制显示属性的工具(下方)
(1)图形复位:使图形缩放到能够最大化地全部显示在图窗体中。
(2)全部节点颜色复位:重设全部节点的颜色。
(3)复位标签颜色:标签颜色恢复默认。
(4)复位标签大小:标签大小恢复默认。
(5)背景颜色:重设背景颜色。
(6)节点标签显示:是否显示节点标签,默认关闭
3、工具全局设置
(1)全局设置Global
自动选择邻居:鼠标指向一个节点后,关联节点显示的方式。
高亮选择:鼠标指向一个节点后,这个节点与其他节点颜色的变化方式,勾选后指向的节点保持原来的颜色,其他节点变暗;取消勾选后,指向的节点变暗,其他节点保持原来颜色。
(2)边
Use node color:指边会使用节点的颜色。
选择颜色:勾选后,把鼠标移动到一个节点后,这个节点出边、入边与双向边会用不同的颜色显示。
(3)label
节点标签大小 共有三种类型:fixed(固定大小,标签大小不跟节点大小变化而变化)、scaled(标签随节点大小变化而变化)、node size(节点越大,标签越大,但标签大小本身是固定的,不随节点大小变化而变化)。
节点标签颜色 共有三种类型:unique表示节点标签和边标签都是用选定的颜色;object表示节点标签使用节点颜色,边标签使用边的颜色;text表示节点标签都使用默认黑色。
隐藏未选定 勾选后,只有鼠标移动到某个节点上后标签才会显示。
重设文本设定 设置在图中节点和边用什么字段作为标签。
(二)布局:节点与边的排布
布局是根据某种策略对节点和边进行排布,使图形既具有特定需要的合理性,也易于视觉识别。它们的核心都是平衡一个网络中节点的斥力和引力关系。一般来说,布局应满足:使节点均匀分布在有限的区域内;避免边的交叉和弯曲;保持边的长度一致;使整体布局能反映图的内在特性。
默认布局(12种)大致可分为两类:一类是力引导布局(6种:force atlas;force atlas2;fruchterman
reingold;openord;yifan hu;yifan hu 比例);另一类是辅助性的、带有编辑和调整性质的布局(6种:noverlap;rotate;扩展;收缩;标签调整;随机布局)
(三)统计:使用算法测度网络
1、根据统计算法,为节点或边计算出不同的数值
2、研究节点的度:度、加权度、pagerank、聚类系数、特征向量中心度、模块化
3、研究边的连接性:网络直径、连接组件
4、研究图的整体特性:平均度、平均加权度、图密度、平均路径长度
5、研究聚类特性:模块化
注:模块化和连接组件都具有某种归类或聚类的特性,但模块化根本上是统计节点的一种度,并在此基础上把度相同的节点归类;连接组件并不考虑节点度的状态,而仅仅是根据连接关系对节点归类。
(四)外观:节点、边、标签设置
自定义或根据数据设置节点的大小、节点颜色、边的粗细、边的颜色以及节点与边的标签的颜色及大小。在以颜色和大小为目标的编辑中,可以通过两种方式实现,一种是设置为统一的(unique)颜色和大小;另一种是根据数值设定(Attribute)颜色和大小。
在外观设置中,一是可以手动统一设定节点、边、标签的大小和颜色,二是可以通过数据自动定义。数据自定义可以有两种方式可以实现:(1)原始数据本身携带了可以用于设置的数值(2)通过gephi统计功能计算出新的数据用于设置。
1、节点
界面右上方的4个按钮(节点颜色、节点大小、节点标签颜色、节点标签大小)会和“统一的”“数值设定”组合产生不同效果。
2、边
界面右上方的3个按钮(边颜色、边标签颜色、边标签大小)会和“统一的”“数值设定”组合产生不同效果。
在gephi0.9.1版本后,节点与边颜色的“数值设定”细分为partition(分区)与ranking(排名),分区是用有区别的颜色给节点或边涂色,排名是用颜色渐变的方式给节点或边涂色。而节点与边的其他属性(节点大小、节点与边的标签颜色和标签大小)则没有细分,只是数值设定更改为ranking,而没有操作上的变动。
(五)滤波:查询、筛选与分类
过滤器fliters是通过用户设定的规则(包括正则表达式)对网络中的节点或边进行筛选,从而能够更精准的探索与分析网络。过滤界面可以分为三部分:4个与过滤有关的工具、过滤选取分类、过滤界面查询工具。
1、四个与过滤有关的工具
重置是清除所有过滤规则;第二个是往过滤的节点中写入数据;第三个是把过滤出的节点和边移动到一个新的工作空间;第四个是隐藏过滤出的节点和边。
2、过滤选取工具(5种)
(1)动态:根据动态图的特性进行过滤
通过约束范围和空值,观察动态图在不同时间段内结构的变化。
(2)属性:根据图节点或边的属性进行过滤
(3)拓扑:根据图的拓扑结构进行过滤
(4)操作分类:逻辑过滤,可以将多个过滤器以某种逻辑关系结合在一起进行过滤
(5)边:根据边的特性进行过滤
[1] Github:gephi/gephi
[2] Bastian M, Heymann S, Jacomy M. Gephi: An Open Source Software for Exploring and Manipulating Networks[C]// INTERNATIONAL AAAI CONFERENCE ON WEBLOGS AND SOCIAL MEDIA; THIRD INTERNATIONAL AAAI CONFERENCE ON WEBLOGS AND SOCIAL MEDIA. 2009.
[3] gephi官网. [EB/OL]. [2018-03-01]. https://gephi.org/