一、新增图神经网络模型和数据集
新增门控注意力网络GaAN [UAI 2018] 新增考虑结构公平性的图对比学习模型GRADE [NeurIPS 2022] 新增将CNN架构推广到非欧式空间的模型GMM [CVPR 2017] 新增考虑节点的文本特征的无监督学习模型TADW [IJCAI 2015] 新增能够捕获长距离依赖的模型MGNNI [NeurIPS 2022] 新增考虑模型增强技巧的图对比学习模型MAGCL [AAAI 2023] 新增基于元路径随机游走的异质图表示学习模型MetaPath2Vec [KDD 2017],HERec [TKDE 2018] 新增缓解异质图中语义混淆现象的模型HPN [TKDE 2021] 新增可解释的异质图注意力网络ieHGCN [TKDE 2021]
修改RGCN模型支持imdb数据集
新增异质图数据集AMiner
二、优化消息传递计算算子性能
GammaGL下的sum拓展算子优化后,相比于原生算子效率提升了144%-3995%,并且随着数据规模的增大,效率提升越明显。 GammaGL下的mean拓展算子优化后,相比于原生算子效率提升了600%-10745%,并且随着数据规模的增大,效率提升越明显。 优化后的sum和mean拓展算子的运行速度优于PyG的scatter_sum和scatter_mean。
三、完善架构设计
用户手册方面 用户手册整体介绍了GammaGL算法库包含各个功能和模块。完善后的用户手册以简洁明了的方式呈现GammaGL算法库每一部分所包含的内容,使用户迅速了解算法库所包含的功能以及模型。使用链接:https://gammagl.readthedocs.io/en/latest/index.html。 算法库架构 GammaGL整体架构使用pybind11进行重构,移除原始的cython开发模式。完善后的架构包括更多的高效数据结构(如sparsegraph),高效的计算函数,后续的开发空间将更宽阔。 数据集使用方法优化 GammaGL数据集使用方法进行优化,默认下载路径更换为 ~/.ggl
,用户使用数据集时,可以不指定下载路径。此外,GammaGL增加缓存机制,用户更换下载路径后,无需重复下载,降低设备存储压力。
四、优化采样方法和third_party的支持
邻居采样 我们重新设计了邻居采样方法,采用了基于edge-index的方法,取代了之前的sparse-graph的方法。这样的改进虽然在采样效率上没有提升,但是邻居采样方法的适配性更加广泛,代码示例可见:sampler(https://github.com/BUPT-GAMMA/GammaGL/tree/main/examples/sampler)。 负采样、边采样和子图采样 我们在新版本中为CPU端引入了负采样、边采样和子图采样的功能。这些功能将帮助用户更好地处理大规模的图数据,提升算法的效率和性能。 third_party的支持 在新版本中我们引入了对第三方库parallel-hashmap(https://github.com/greg7mdp/parallel-hashmap)的支持,从而能够减少开发代码的工作量,使用户的想法能够快速地实现。 随机游走序列采样 在新版本中优化了随机游走序列的采样方法,利用Numba库对采样过程进行加速,从而能够实现采样速率的提升。
五、未来计划
更多的图神经网络模型,数据集支持 推荐模型的训练和支持 增加tensorflow、paddle和mindspore后端下常用的消息传递算子 增加考虑连边特征的融合算子 增加对于cuda版本的支持 其他各方面的优化
长按下图并点击“识别图中二维码”
即可关注北邮 GAMMA Lab 公众号

推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...