• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

双子星:高效集成数百个基因网络的方法,支持高阶池化。

Gemini: memory-efficient integration of hundreds of gene networks with high-order pooling.

机构信息

Paul G. Allen School of Computer Science and Engineering, University of Washington, Seattle, WA 98195, United States.

出版信息

Bioinformatics. 2023 Jun 30;39(39 Suppl 1):i504-i512. doi: 10.1093/bioinformatics/btad247.

DOI:10.1093/bioinformatics/btad247
PMID:37387142
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10311345/
Abstract

MOTIVATION

The exponential growth of genomic sequencing data has created ever-expanding repositories of gene networks. Unsupervised network integration methods are critical to learn informative representations for each gene, which are later used as features for downstream applications. However, these network integration methods must be scalable to account for the increasing number of networks and robust to an uneven distribution of network types within hundreds of gene networks.

RESULTS

To address these needs, we present Gemini, a novel network integration method that uses memory-efficient high-order pooling to represent and weight each network according to its uniqueness. Gemini then mitigates the uneven network distribution through mixing up existing networks to create many new networks. We find that Gemini leads to more than a 10% improvement in F1 score, 15% improvement in micro-AUPRC, and 63% improvement in macro-AUPRC for human protein function prediction by integrating hundreds of networks from BioGRID, and that Gemini's performance significantly improves when more networks are added to the input network collection, while Mashup and BIONIC embeddings' performance deteriorates. Gemini thereby enables memory-efficient and informative network integration for large gene networks and can be used to massively integrate and analyze networks in other domains.

AVAILABILITY AND IMPLEMENTATION

Gemini can be accessed at: https://github.com/MinxZ/Gemini.

摘要

动机

基因组测序数据的指数级增长已经创建了不断扩展的基因网络存储库。无监督的网络集成方法对于学习每个基因的信息表示至关重要,这些表示后来被用作下游应用的特征。然而,这些网络集成方法必须具有可扩展性,以适应不断增加的网络数量,并且必须具有鲁棒性,以应对数百个基因网络中网络类型分布不均的问题。

结果

为了满足这些需求,我们提出了 Gemini,这是一种新颖的网络集成方法,它使用内存高效的高阶池化来根据每个网络的独特性来表示和加权每个网络。然后,通过混合现有网络来创建许多新网络,从而缓解网络分布不均的问题。我们发现,通过整合来自 BioGRID 的数百个网络,用于人类蛋白质功能预测的 Gemini 在 F1 分数上提高了 10%以上,在 micro-AUPRC 上提高了 15%,在 macro-AUPRC 上提高了 63%,并且随着输入网络集合中添加更多网络,Gemini 的性能显著提高,而 Mashup 和 BIONIC 嵌入的性能则恶化。因此,Gemini 能够实现对大型基因网络的高效内存和信息网络集成,并可用于大规模集成和分析其他领域的网络。

可用性和实现

可以在 https://github.com/MinxZ/Gemini 上访问 Gemini。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/edfdade8d052/btad247f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/81df43f78930/btad247f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/c606cc0be7b3/btad247f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/ce775d7c3dcd/btad247f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/edfdade8d052/btad247f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/81df43f78930/btad247f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/c606cc0be7b3/btad247f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/ce775d7c3dcd/btad247f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1ca9/10311345/edfdade8d052/btad247f4.jpg

相似文献

1
Gemini: memory-efficient integration of hundreds of gene networks with high-order pooling.双子星:高效集成数百个基因网络的方法,支持高阶池化。
Bioinformatics. 2023 Jun 30;39(39 Suppl 1):i504-i512. doi: 10.1093/bioinformatics/btad247.
2
Metabolic constraint-based refinement of transcriptional regulatory networks.基于代谢约束的转录调控网络精细化研究
PLoS Comput Biol. 2013;9(12):e1003370. doi: 10.1371/journal.pcbi.1003370. Epub 2013 Dec 5.
3
GNE: a deep learning framework for gene network inference by aggregating biological information.GNE:一种通过整合生物信息进行基因网络推断的深度学习框架。
BMC Syst Biol. 2019 Apr 5;13(Suppl 2):38. doi: 10.1186/s12918-019-0694-y.
4
deepNF: deep network fusion for protein function prediction.深度网络融合的蛋白质功能预测。
Bioinformatics. 2018 Nov 15;34(22):3873-3881. doi: 10.1093/bioinformatics/bty440.
5
Predictive regulatory models in Drosophila melanogaster by integrative inference of transcriptional networks.通过整合转录网络推断,预测果蝇中的调控模型。
Genome Res. 2012 Jul;22(7):1334-49. doi: 10.1101/gr.127191.111. Epub 2012 Mar 28.
6
Comparison of single and module-based methods for modeling gene regulatory networks.比较基于单模块和基于模块的基因调控网络建模方法。
Bioinformatics. 2020 Jan 15;36(2):558-567. doi: 10.1093/bioinformatics/btz549.
7
Driver gene detection through Bayesian network integration of mutation and expression profiles.通过突变和表达谱的贝叶斯网络集成进行驱动基因检测。
Bioinformatics. 2022 May 13;38(10):2781-2790. doi: 10.1093/bioinformatics/btac203.
8
SJARACNe: a scalable software tool for gene network reverse engineering from big data.SJARACNe:一种从大数据中进行基因网络反向工程的可扩展软件工具。
Bioinformatics. 2019 Jun 1;35(12):2165-2166. doi: 10.1093/bioinformatics/bty907.
9
BIONIC: biological network integration using convolutions.仿生学:使用卷积进行生物网络集成。
Nat Methods. 2022 Oct;19(10):1250-1261. doi: 10.1038/s41592-022-01616-x. Epub 2022 Oct 3.
10
A Protocol for the Construction and Curation of Genome-Scale Integrated Metabolic and Regulatory Network Models.一种构建和管理基因组规模综合代谢与调控网络模型的方案。
Methods Mol Biol. 2019;1927:203-214. doi: 10.1007/978-1-4939-9142-6_14.

本文引用的文献

1
BIONIC: biological network integration using convolutions.仿生学:使用卷积进行生物网络集成。
Nat Methods. 2022 Oct;19(10):1250-1261. doi: 10.1038/s41592-022-01616-x. Epub 2022 Oct 3.
2
Topsy-Turvy: integrating a global view into sequence-based PPI prediction.天翻地覆:将全局观点纳入基于序列的蛋白质-蛋白质相互作用预测中。
Bioinformatics. 2022 Jun 24;38(Suppl 1):i264-i272. doi: 10.1093/bioinformatics/btac258.
3
A multi-scale map of cell structure fusing protein images and interactions.融合蛋白质图像和相互作用的多尺度细胞结构图。
Nature. 2021 Dec;600(7889):536-542. doi: 10.1038/s41586-021-04115-9. Epub 2021 Nov 24.
4
The BioGRID database: A comprehensive biomedical resource of curated protein, genetic, and chemical interactions.The BioGRID 数据库:一个经过精心整理的生物医学资源,包含蛋白质、遗传和化学相互作用。
Protein Sci. 2021 Jan;30(1):187-200. doi: 10.1002/pro.3978. Epub 2020 Nov 23.
5
Large-scale metabolic interaction network of the mouse and human gut microbiota.大规模代谢相互作用网络的小鼠和人类肠道微生物群。
Sci Data. 2020 Jun 26;7(1):204. doi: 10.1038/s41597-020-0516-5.
6
Integrating multi-network topology for gene function prediction using deep neural networks.使用深度神经网络整合多网络拓扑结构进行基因功能预测。
Brief Bioinform. 2021 Mar 22;22(2):2096-2105. doi: 10.1093/bib/bbaa036.
7
A consensus S. cerevisiae metabolic model Yeast8 and its ecosystem for comprehensively probing cellular metabolism.共识 S. cerevisiae 代谢模型 Yeast8 及其生态系统,用于全面探究细胞代谢。
Nat Commun. 2019 Aug 8;10(1):3586. doi: 10.1038/s41467-019-11581-3.
8
STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets.STRING v11:具有增强覆盖范围的蛋白质-蛋白质相互作用网络,支持在全基因组实验数据集的功能发现。
Nucleic Acids Res. 2019 Jan 8;47(D1):D607-D613. doi: 10.1093/nar/gky1131.
9
deepNF: deep network fusion for protein function prediction.深度网络融合的蛋白质功能预测。
Bioinformatics. 2018 Nov 15;34(22):3873-3881. doi: 10.1093/bioinformatics/bty440.
10
Analysis of the relationship between coexpression domains and chromatin 3D organization.共表达结构域与染色质三维组织之间关系的分析。
PLoS Comput Biol. 2017 Sep 13;13(9):e1005708. doi: 10.1371/journal.pcbi.1005708. eCollection 2017 Sep.