• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PecanPy:node2vec的一种快速、高效且并行化的Python实现。

PecanPy: a fast, efficient and parallelized Python implementation of node2vec.

作者信息

Liu Renming, Krishnan Arjun

机构信息

Department of Computational Mathematics, Science and Engineering, Michigan State University, East Lansing, MI 48824, USA.

Department of Biochemistry and Molecular Biology, Michigan State University, East Lansing, MI 48824, USA.

出版信息

Bioinformatics. 2021 Oct 11;37(19):3377-3379. doi: 10.1093/bioinformatics/btab202.

DOI:10.1093/bioinformatics/btab202
PMID:33760066
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8504639/
Abstract

SUMMARY

Learning low-dimensional representations (embeddings) of nodes in large graphs is key to applying machine learning on massive biological networks. Node2vec is the most widely used method for node embedding. However, its original Python and C++ implementations scale poorly with network density, failing for dense biological networks with hundreds of millions of edges. We have developed PecanPy, a new Python implementation of node2vec that uses cache-optimized compact graph data structures and precomputing/parallelization to result in fast, high-quality node embeddings for biological networks of all sizes and densities.

AVAILABILITYAND IMPLEMENTATION

PecanPy software is freely available at https://github.com/krishnanlab/PecanPy.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

学习大型图中节点的低维表示(嵌入)是在大规模生物网络上应用机器学习的关键。Node2vec是最广泛使用的节点嵌入方法。然而,其原始的Python和C++实现随着网络密度的增加扩展性较差,对于具有数亿条边的密集生物网络会失效。我们开发了PecanPy,这是一种新的Node2vec的Python实现,它使用缓存优化的紧凑图数据结构以及预计算/并行化,可为各种规模和密度的生物网络生成快速、高质量的节点嵌入。

可用性和实现

PecanPy软件可在https://github.com/krishnanlab/PecanPy上免费获取。

补充信息

补充数据可在《生物信息学》在线版获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d899/8504639/8b958b1cfc41/btab202f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d899/8504639/8b958b1cfc41/btab202f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d899/8504639/8b958b1cfc41/btab202f1.jpg

相似文献

1
PecanPy: a fast, efficient and parallelized Python implementation of node2vec.PecanPy:node2vec的一种快速、高效且并行化的Python实现。
Bioinformatics. 2021 Oct 11;37(19):3377-3379. doi: 10.1093/bioinformatics/btab202.
2
Accurately modeling biased random walks on weighted networks using node2vec.使用 node2vec 准确建模加权网络上有偏随机游走。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad047.
3
BioKEEN: a library for learning and evaluating biological knowledge graph embeddings.BioKEEN:用于学习和评估生物知识图嵌入的库。
Bioinformatics. 2019 Sep 15;35(18):3538-3540. doi: 10.1093/bioinformatics/btz117.
4
PyGenePlexus: a Python package for gene discovery using network-based machine learning.PyGenePlexus:一个使用基于网络的机器学习进行基因发现的 Python 包。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad064.
5
mOWL: Python library for machine learning with biomedical ontologies.mOWL:用于生物医学本体机器学习的 Python 库。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac811.
6
node2vec: Scalable Feature Learning for Networks.节点2向量:网络的可扩展特征学习
KDD. 2016 Aug;2016:855-864. doi: 10.1145/2939672.2939754.
7
NeuroPycon: An open-source python toolbox for fast multi-modal and reproducible brain connectivity pipelines.NeuroPycon:一个开源的 Python 工具包,用于快速进行多模态和可重复的脑连接管道。
Neuroimage. 2020 Oct 1;219:117020. doi: 10.1016/j.neuroimage.2020.117020. Epub 2020 Jun 6.
8
Neuro-symbolic representation learning on biological knowledge graphs.生物知识图谱上的神经符号表示学习。
Bioinformatics. 2017 Sep 1;33(17):2723-2730. doi: 10.1093/bioinformatics/btx275.
9
Graph Transformer Networks: Learning meta-path graphs to improve GNNs.图 Transformer 网络:学习元路径图以改进 GNNs。
Neural Netw. 2022 Sep;153:104-119. doi: 10.1016/j.neunet.2022.05.026. Epub 2022 Jun 4.
10
GRAPE for fast and scalable graph processing and random-walk-based embedding.GRAPE 用于快速可扩展的图处理和基于随机游走的嵌入。
Nat Comput Sci. 2023 Jun;3(6):552-568. doi: 10.1038/s43588-023-00465-8. Epub 2023 Jun 26.

引用本文的文献

1
Network-based representation learning reveals the impact of age and diet on the gut microbial and metabolomic environment of U.S. infants in a randomized controlled feeding trial.基于网络的表征学习揭示了在一项随机对照喂养试验中年龄和饮食对美国婴儿肠道微生物和代谢组学环境的影响。
bioRxiv. 2025 May 22:2024.11.01.621627. doi: 10.1101/2024.11.01.621627.
2
A best-match approach for gene set analyses in embedding spaces.一种在嵌入空间中进行基因集分析的最佳匹配方法。
Genome Res. 2024 Oct 11;34(9):1421-1433. doi: 10.1101/gr.279141.124.
3
StaVia: spatially and temporally aware cartography with higher-order random walks for cell atlases.
StaVia:具有高阶随机游走的时空感知制图技术,用于细胞图谱。
Genome Biol. 2024 Aug 16;25(1):224. doi: 10.1186/s13059-024-03347-y.
4
Joint representation of molecular networks from multiple species improves gene classification.来自多个物种的分子网络的联合表示改善了基因分类。
PLoS Comput Biol. 2024 Jan 10;20(1):e1011773. doi: 10.1371/journal.pcbi.1011773. eCollection 2024 Jan.
5
Edge-based graph neural network for ranking critical road segments in a network.基于边的图神经网络在网络中对关键路段进行排序。
PLoS One. 2023 Dec 21;18(12):e0296045. doi: 10.1371/journal.pone.0296045. eCollection 2023.
6
Effective Subject Representation based on Multi-omics Disease Networks using Graph Embedding.基于图嵌入的多组学疾病网络的有效主题表示
Proceedings (IEEE Int Conf Bioinformatics Biomed). 2022 Dec;2022:1911-1918. doi: 10.1109/bibm55620.2022.9995707.
7
scMINER: a mutual information-based framework for identifying hidden drivers from single-cell omics data.scMINER:一种基于互信息的框架,用于从单细胞组学数据中识别潜在驱动因素。
Res Sq. 2023 Jan 27:rs.3.rs-2476875. doi: 10.21203/rs.3.rs-2476875/v1.
8
scMINER: a mutual information-based framework for identifying hidden drivers from single-cell omics data.scMINER:一种基于互信息的框架,用于从单细胞组学数据中识别隐藏驱动因素。
bioRxiv. 2023 Jan 27:2023.01.26.523391. doi: 10.1101/2023.01.26.523391.
9
PyGenePlexus: a Python package for gene discovery using network-based machine learning.PyGenePlexus:一个使用基于网络的机器学习进行基因发现的 Python 包。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad064.
10
Accurately modeling biased random walks on weighted networks using node2vec.使用 node2vec 准确建模加权网络上有偏随机游走。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad047.