• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

神经集体矩阵分解用于异构生物医学数据的综合分析。

Neural Collective Matrix Factorization for integrated analysis of heterogeneous biomedical data.

机构信息

Department of Information Systems and Analytics, School of Computing, National University of Singapore, Singapore 117417, Singapore.

出版信息

Bioinformatics. 2022 Sep 30;38(19):4554-4561. doi: 10.1093/bioinformatics/btac543.

DOI:10.1093/bioinformatics/btac543
PMID:35929808
Abstract

MOTIVATION

In many biomedical studies, there arises the need to integrate data from multiple directly or indirectly related sources. Collective matrix factorization (CMF) and its variants are models designed to collectively learn from arbitrary collections of matrices. The latent factors learnt are rich integrative representations that can be used in downstream tasks, such as clustering or relation prediction with standard machine-learning models. Previous CMF-based methods have numerous modeling limitations. They do not adequately capture complex non-linear interactions and do not explicitly model varying sparsity and noise levels in the inputs, and some cannot model inputs with multiple datatypes. These inadequacies limit their use on many biomedical datasets.

RESULTS

To address these limitations, we develop Neural Collective Matrix Factorization (NCMF), the first fully neural approach to CMF. We evaluate NCMF on relation prediction tasks of gene-disease association prediction and adverse drug event prediction, using multiple datasets. In each case, data are obtained from heterogeneous publicly available databases and used to learn representations to build predictive models. NCMF is found to outperform previous CMF-based methods and several state-of-the-art graph embedding methods for representation learning in our experiments. Our experiments illustrate the versatility and efficacy of NCMF in representation learning for seamless integration of heterogeneous data.

AVAILABILITY AND IMPLEMENTATION

https://github.com/ajayago/NCMF_bioinformatics.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

在许多生物医学研究中,需要整合来自多个直接或间接相关来源的数据。集体矩阵分解(CMF)及其变体是为从任意矩阵集合中集体学习而设计的模型。学到的潜在因子是丰富的综合表示,可以在下游任务中使用,例如使用标准机器学习模型进行聚类或关系预测。以前基于 CMF 的方法存在许多建模限制。它们不能充分捕捉复杂的非线性相互作用,也不能显式地对输入中的变化稀疏度和噪声水平进行建模,并且有些方法不能对具有多种数据类型的输入进行建模。这些不足限制了它们在许多生物医学数据集上的使用。

结果

为了解决这些限制,我们开发了神经集体矩阵分解(NCMF),这是第一个完全基于神经的 CMF 方法。我们在基因-疾病关联预测和不良药物事件预测的关系预测任务上评估了 NCMF,使用了多个数据集。在每种情况下,数据都是从异构的公共可用数据库中获得的,并用于学习表示来构建预测模型。在我们的实验中,NCMF 被发现优于以前基于 CMF 的方法和几种最先进的图嵌入方法的表示学习。我们的实验说明了 NCMF 在表示学习中的多功能性和有效性,用于异构数据的无缝集成。

可用性和实现

https://github.com/ajayago/NCMF_bioinformatics。

补充信息

补充数据可在《生物信息学》在线获得。

相似文献

1
Neural Collective Matrix Factorization for integrated analysis of heterogeneous biomedical data.神经集体矩阵分解用于异构生物医学数据的综合分析。
Bioinformatics. 2022 Sep 30;38(19):4554-4561. doi: 10.1093/bioinformatics/btac543.
2
Patient Representation Learning From Heterogeneous Data Sources and Knowledge Graphs Using Deep Collective Matrix Factorization: Evaluation Study.使用深度集体矩阵分解从异构数据源和知识图谱中进行患者表示学习:评估研究
JMIR Med Inform. 2022 Jan 20;10(1):e28842. doi: 10.2196/28842.
3
Graph embedding on biomedical networks: methods, applications and evaluations.生物医学网络上的图嵌入:方法、应用和评估。
Bioinformatics. 2020 Feb 15;36(4):1241-1251. doi: 10.1093/bioinformatics/btz718.
4
Predicting synthetic lethal interactions using heterogeneous data sources.利用异构数据源预测合成致死相互作用。
Bioinformatics. 2020 Apr 1;36(7):2209-2216. doi: 10.1093/bioinformatics/btz893.
5
A graph regularized generalized matrix factorization model for predicting links in biomedical bipartite networks.一种基于图正则化广义矩阵分解模型的生物医学二部网络链路预测方法。
Bioinformatics. 2020 Jun 1;36(11):3474-3481. doi: 10.1093/bioinformatics/btaa157.
6
Representation learning via Dual-Autoencoder for recommendation.通过双自动编码器进行推荐的表示学习。
Neural Netw. 2017 Jun;90:83-89. doi: 10.1016/j.neunet.2017.03.009. Epub 2017 Mar 27.
7
Computational drug repositioning based on multi-similarities bilinear matrix factorization.基于多相似度双线性矩阵分解的计算药物重定位。
Brief Bioinform. 2021 Jul 20;22(4). doi: 10.1093/bib/bbaa267.
8
Protease target prediction via matrix factorization.基于矩阵分解的蛋白酶靶标预测。
Bioinformatics. 2019 Mar 15;35(6):923-929. doi: 10.1093/bioinformatics/bty746.
9
Graph contextualized attention network for predicting synthetic lethality in human cancers.用于预测人类癌症中合成致死性的图上下文注意力网络。
Bioinformatics. 2021 Aug 25;37(16):2432-2440. doi: 10.1093/bioinformatics/btab110.
10
Text mining-based word representations for biomedical data analysis and protein-protein interaction networks in machine learning tasks.基于文本挖掘的词表示在生物医学数据分析和机器学习任务中的蛋白质-蛋白质相互作用网络。
PLoS One. 2021 Oct 15;16(10):e0258623. doi: 10.1371/journal.pone.0258623. eCollection 2021.

引用本文的文献

1
A multi-task domain-adapted model to predict chemotherapy response from mutations in recurrently altered cancer genes.一种多任务域适应模型,用于根据复发性改变的癌症基因中的突变预测化疗反应。
iScience. 2025 Feb 11;28(3):111992. doi: 10.1016/j.isci.2025.111992. eCollection 2025 Mar 21.
2
Identifying behavior regulatory leverage over mental disorders transcriptomic network hubs toward lifestyle-dependent psychiatric drugs repurposing.识别针对精神障碍转录组网络枢纽的行为调节杠杆作用,以实现依赖生活方式的精神科药物重新利用。
Hum Genomics. 2025 Mar 19;19(1):29. doi: 10.1186/s40246-025-00733-w.