592
浏览基于边嵌入表示的复杂网络链路预测算法研究
摘要:现实生活中复杂、多变的网络系统都能表示成图数据。近年来,图嵌入技术逐渐成为研究复杂网络图的重要方法之一,有着深远的研究意义和广泛的应用价值。图嵌入是对图的特征信息进行高效的提取,并表示成低维稠密向量,可用于链路预测、节点分类等网络分析中。链路预测是对复杂网络中潜在的或未被发现的链接进行预测,应用广泛。本文基于对图数据的研究,提出了两种改进的链路预测算法和一种改进的图嵌入算法,并在多个真实数据集上进行对比实验。具体研究工作如下:(1)本文针对基本随机游走相似性指标的转移概率仅由当前节点的度决定而使链路预测效果不甚理想的问题,在Metropolis-Hasting(MH)算法的基础上,综合利用当前节点与邻居节点的度信息重新定义节点间的转移概率,并采用将当前节点的自环率按邻居节点的度值加权分配给邻居节点的方法重构概率矩阵,再融合重启随机游走相似性指标,提出一种改进MH的链路预测算法IMRWR。链路预测实验表明,本文算法在AUC和排序分指标上均有提升,提高了预测的准确性。(2)针对现有的基于Word2Vec模型的图嵌入算法没有利用被采样节点在采样过程中的主动性而造成获得的节点序列质量不高、影响节点嵌入效果的问题,本文提出一种改进的图嵌入算法Line2Vec,其能综合考虑当前节点与邻居节点共同对游走概率的影响,采用无偏+有偏的灵活随机游走邻域采样策略,以充分调动下一个被采样节点在采样过程中的主动性,从而增强游走过程中生成节点序列的质量、得到表示性能更强的节点向量。节点分类和链路预测实验表明,本文算法有着更高的Micro-F1、Macro-F1和AUC值,增强了节点向量的表示性。(3)针对网络分析方法中研究的图数据默认使用节点图,只能得到节点的向量表示,不能直接将边表示成向量的问题,本文通过将节点图转换成连边图,再送入能够同时处理节点图与连边图的算法Line2Vec中,以直接得到边向量,并结合首次使用的关联矩阵得到不存在边的向量表示,提出一种边嵌入链路预测算法Line2Vec-L。本算法生成的边向量包含图的一手信息未被稀释、弱化,更具代表性。链路预测实验表明,算法Line2Vec-L的AUC值更高,生成的边向量表示性更强。
关键词:链路预测;图嵌
文章目录
摘要
Abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 图嵌入的研究现状
1.2.2 链路预测的研究现状
1.3 本文主要研究内容
1.4 论文组织结构
1.5 本章小结
第2章 图的相关知识概述
2.1 图论
2.1.1 图的分类
2.1.2 图的数学定义
2.2 图的拓扑特征
2.2.1 度系数
2.2.2 聚集系数
2.2.3 路径特征
2.2.4 节点中心性
2.3 图嵌入
2.3.1 图嵌入概述
2.3.2 图嵌入算法
2.4 图嵌入的下游任务
2.4.1 链路预测
2.4.2 节点分类
2.5 本章小结
第3章 基于MH改进的重启随机游走链路预测算法
3.1 引言
3.2 改进的链路预测算法描述
3.2.1 MHRW算法
3.2.2 IMRWR算法思想
3.2.3 算法流程
3.2.4 s收敛性证明
3.3 基于MH改进的重启随机游走链路预测算法实验分析
3.3.1 基准方法
3.3.2 实验数据集
3.3.3 实验结果及分析
3.4 本章小结
第4章 基于综合游走策略的图嵌入算法研究
4.1 引言
4.2 基于综合游走策略的图嵌入算法描述
4.2.1 词嵌入模型
4.2.2 Line2Vec的游走模式
4.2.3 算法流程
4.3 基于综合游走策略的图嵌入算法实验分析
4.3.1 基准方法和参数设置
4.3.2 实验数据集
4.3.3 实验结果及分析
4.4 本章小结
第5章 基于综合游走策略的边嵌入链路预测算法分析
5.1 引言
5.2 边嵌入链路预测算法描述
5.2.1 连边图
5.2.2 关联矩阵
5.2.3 生成边向量
5.3 基于综合游走策略的边嵌入链路预测算法实验分析
5.3.1 基准方法和参数设置
5.3.2 实验数据集
5.3.3 实验结果及分析
5.4 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
[1]面向自然语言处理的预训练技术研究综述[J]. 李舟军,范宇,吴贤杰. 计算机科学. 2020(03)
[2]链路预测的方法与发展综述[J]. 张月霞,冯译萱. 测控技术. 2019(02)
[3]基于有偏向的重启随机游走链路预测算法[J]. 吕亚楠,韩华,贾承丰,瞿倩倩. 复杂系统与复杂性科学. 2018(04)
[4]基于改进随机游走的网络表示学习算法[J]. 王文涛,黄烨,吴淋涛,柯璇,唐菀. 计算机应用. 2019(03)
[5]基于网络表示学习与随机游走的链路预测算法[J]. 刘思,刘海,陈启买,贺超波. 计算机应用. 2017(08)
[6]四色定理的简单证明[J]. 曹晟. 数学学习与研究. 2017(08)
[7]在线社会网络无偏采样技术[J]. 王栋,李振宇,谢高岗. 计算机研究与发展. 2016(05)
[8]深度学习研究与进展[J]. 孙志远,鲁成祥,史忠植,马刚. 计算机科学. 2016(02)
[9]网络表示学习[J]. 陈维政,张岩,李晓明. 大数据. 2015(03)
[10]复杂网络中节点重要性排序的研究进展[J]. 刘建国,任卓明,郭强,汪秉宏. 物理学报. 2013(17)