• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种基于实体关系图的数据融合新方法及其在蛋白质-蛋白质相互作用预测中的应用。

A novel method for data fusion over entity-relation graphs and its application to protein-protein interaction prediction.

作者信息

Raimondi Daniele, Simm Jaak, Arany Adam, Moreau Yves

机构信息

ESAT-STADIUS, KU Leuven, 3001 Leuven, Belgium.

出版信息

Bioinformatics. 2021 Aug 25;37(16):2275-2281. doi: 10.1093/bioinformatics/btab092.

DOI:10.1093/bioinformatics/btab092
PMID:33560405
Abstract

MOTIVATION

Modern bioinformatics is facing increasingly complex problems to solve, and we are indeed rapidly approaching an era in which the ability to seamlessly integrate heterogeneous sources of information will be crucial for the scientific progress. Here, we present a novel non-linear data fusion framework that generalizes the conventional matrix factorization paradigm allowing inference over arbitrary entity-relation graphs, and we applied it to the prediction of protein-protein interactions (PPIs). Improving our knowledge of PPI networks at the proteome scale is indeed crucial to understand protein function, physiological and disease states and cell life in general.

RESULTS

We devised three data fusion-based models for the proteome-level prediction of PPIs, and we show that our method outperforms state of the art approaches on common benchmarks. Moreover, we investigate its predictions on newly published PPIs, showing that this new data has a clear shift in its underlying distributions and we thus train and test our models on this extended dataset.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

现代生物信息学面临着日益复杂的问题需要解决,而且我们确实正在迅速进入一个时代,在这个时代,无缝整合异构信息源的能力对于科学进步至关重要。在此,我们提出了一种新颖的非线性数据融合框架,该框架推广了传统的矩阵分解范式,允许对任意实体关系图进行推理,并将其应用于蛋白质 - 蛋白质相互作用(PPI)的预测。在蛋白质组规模上改善我们对PPI网络的认识对于理解蛋白质功能、生理和疾病状态以及一般细胞生命确实至关重要。

结果

我们设计了三种基于数据融合的模型用于蛋白质组水平的PPI预测,并且我们表明我们的方法在常见基准测试中优于现有方法。此外,我们研究了其对新发表的PPI的预测,表明这些新数据在其基础分布上有明显变化,因此我们在这个扩展数据集上训练和测试我们的模型。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
A novel method for data fusion over entity-relation graphs and its application to protein-protein interaction prediction.一种基于实体关系图的数据融合新方法及其在蛋白质-蛋白质相互作用预测中的应用。
Bioinformatics. 2021 Aug 25;37(16):2275-2281. doi: 10.1093/bioinformatics/btab092.
2
Nonlinear data fusion over Entity-Relation graphs for Drug-Target Interaction prediction.基于实体关系图的非线性数据融合的药物-靶标相互作用预测。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad348.
3
Computational probing protein-protein interactions targeting small molecules.针对小分子的蛋白质-蛋白质相互作用的计算探测
Bioinformatics. 2016 Jan 15;32(2):226-34. doi: 10.1093/bioinformatics/btv528. Epub 2015 Sep 28.
4
Minimum curvilinearity to enhance topological prediction of protein interactions by network embedding.最小曲率增强网络嵌入的蛋白质相互作用拓扑预测。
Bioinformatics. 2013 Jul 1;29(13):i199-209. doi: 10.1093/bioinformatics/btt208.
5
Predicting synthetic lethal interactions using heterogeneous data sources.利用异构数据源预测合成致死相互作用。
Bioinformatics. 2020 Apr 1;36(7):2209-2216. doi: 10.1093/bioinformatics/btz893.
6
Matrix factorization-based data fusion for the prediction of lncRNA-disease associations.基于矩阵分解的数据融合方法用于 lncRNA-疾病关联预测。
Bioinformatics. 2018 May 1;34(9):1529-1537. doi: 10.1093/bioinformatics/btx794.
7
Fuse: multiple network alignment via data fusion.Fuse:通过数据融合进行多重网络比对。
Bioinformatics. 2016 Apr 15;32(8):1195-203. doi: 10.1093/bioinformatics/btv731. Epub 2015 Dec 14.
8
Neural Collective Matrix Factorization for integrated analysis of heterogeneous biomedical data.神经集体矩阵分解用于异构生物医学数据的综合分析。
Bioinformatics. 2022 Sep 30;38(19):4554-4561. doi: 10.1093/bioinformatics/btac543.
9
Pre-training graph neural networks for link prediction in biomedical networks.用于生物医学网络中链接预测的预训练图神经网络。
Bioinformatics. 2022 Apr 12;38(8):2254-2262. doi: 10.1093/bioinformatics/btac100.
10
Unsupervised construction of computational graphs for gene expression data with explicit structural inductive biases.无监督构建具有显式结构归纳偏差的基因表达数据的计算图。
Bioinformatics. 2022 Feb 7;38(5):1320-1327. doi: 10.1093/bioinformatics/btab830.

引用本文的文献

1
The specification game: rethinking the evaluation of drug response prediction for precision oncology.规范博弈:重新思考精准肿瘤学中药物反应预测的评估以提高精准度
J Cheminform. 2025 Mar 14;17(1):33. doi: 10.1186/s13321-025-00972-y.
2
A comparison of embedding aggregation strategies in drug-target interaction prediction.在药物-靶标相互作用预测中比较嵌入聚合策略。
BMC Bioinformatics. 2024 Feb 6;25(1):59. doi: 10.1186/s12859-024-05684-y.
3
Nonlinear data fusion over Entity-Relation graphs for Drug-Target Interaction prediction.基于实体关系图的非线性数据融合的药物-靶标相互作用预测。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad348.
4
Long-distance dependency combined multi-hop graph neural networks for protein-protein interactions prediction.长程依赖的多跳图神经网络用于蛋白质相互作用预测。
BMC Bioinformatics. 2022 Dec 5;23(1):521. doi: 10.1186/s12859-022-05062-6.
5
Deep learning frameworks for protein-protein interaction prediction.用于蛋白质-蛋白质相互作用预测的深度学习框架。
Comput Struct Biotechnol J. 2022 Jun 15;20:3223-3233. doi: 10.1016/j.csbj.2022.06.025. eCollection 2022.
6
A virus-target host proteins recognition method based on integrated complexes data and seed extension.一种基于整合复合物数据和种子延伸的病毒靶标宿主蛋白识别方法。
BMC Bioinformatics. 2022 Jun 28;23(1):256. doi: 10.1186/s12859-022-04792-x.
7
HPMPdb: A machine learning-ready database of protein molecular phenotypes associated to human missense variants.HPMPdb:一个可供机器学习使用的、与人类错义变体相关的蛋白质分子表型数据库。
Curr Res Struct Biol. 2022 May 13;4:167-174. doi: 10.1016/j.crstbi.2022.04.004. eCollection 2022.
8
From genotype to phenotype in Arabidopsis thaliana: in-silico genome interpretation predicts 288 phenotypes from sequencing data.拟南芥从基因型到表型:基于测序数据的计算机基因组解读预测 288 种表型。
Nucleic Acids Res. 2022 Feb 22;50(3):e16. doi: 10.1093/nar/gkab1099.