• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GNPI:用于整合系统发生信息的图规范化,以进行宏基因组宿主表型预测。

GNPI: Graph normalization to integrate phylogenetic information for metagenomic host phenotype prediction.

机构信息

Hubei Key Laboratory of Artificial Intelligence and Smart Learning, Central China Normal University, Wuhan, China; School of Computer, Central China Normal University, Wuhan, China.

Mathematics and Science College, Shanghai Normal University, Shanghai, China.

出版信息

Methods. 2022 Sep;205:11-17. doi: 10.1016/j.ymeth.2022.05.007. Epub 2022 May 27.

DOI:10.1016/j.ymeth.2022.05.007
PMID:35636652
Abstract

Microorganisms play important roles in our lives especially on metabolism and diseases. Determining the probability of human suffering from specific diseases and the severity of the disease based on microbial genes is the crucial research for understanding the relationship between microbes and diseases. Previous could extract the topological information of phylogenetic trees and integrate them to metagenomic datasets, thus enable classifiers to learn more information in limited datasets and thus improve the performance of the models. In this paper, we proposed a GNPI model to better learn the structure of phylogenetic trees. GNPI maintained the original vector format of metagenomic datasets, while previous research had to change the input form to matrices. The vector-like form of the input data can be easily adopted in the baseline machine learning models and is available for deep learning models. The datasets processed with GNPI help enhance the accuracy of machine learning and deep learning models in three different datasets. GNPI is an interpretable data processing method for host phenotype prediction and other bioinformatics tasks.

摘要

微生物在我们的生活中扮演着重要的角色,特别是在新陈代谢和疾病方面。基于微生物基因来确定人类患特定疾病的概率和疾病的严重程度,是理解微生物与疾病之间关系的关键研究。先前的研究可以提取系统发育树的拓扑信息并将其整合到宏基因组数据集中,从而使分类器能够从有限的数据集中学习更多信息,从而提高模型的性能。在本文中,我们提出了一种 GNPI 模型,以更好地学习系统发育树的结构。GNPI 保持了宏基因组数据集的原始向量格式,而先前的研究必须将输入形式更改为矩阵。输入数据的向量形式可以很容易地应用于基线机器学习模型,并可用于深度学习模型。使用 GNPI 处理的数据集有助于提高三种不同数据集的机器学习和深度学习模型的准确性。GNPI 是一种用于宿主表型预测和其他生物信息学任务的可解释数据处理方法。

相似文献

1
GNPI: Graph normalization to integrate phylogenetic information for metagenomic host phenotype prediction.GNPI:用于整合系统发生信息的图规范化,以进行宏基因组宿主表型预测。
Methods. 2022 Sep;205:11-17. doi: 10.1016/j.ymeth.2022.05.007. Epub 2022 May 27.
2
A permutable MLP-like architecture for disease prediction from gut metagenomic data.一种可置换的类似于多层感知机的架构,用于从肠道宏基因组数据中进行疾病预测。
BMC Bioinformatics. 2024 Jul 24;25(1):246. doi: 10.1186/s12859-024-05856-w.
3
Automatic disease prediction from human gut metagenomic data using boosting GraphSAGE.基于提升图抽样的人类肠道宏基因组数据自动疾病预测。
BMC Bioinformatics. 2023 Mar 31;24(1):126. doi: 10.1186/s12859-023-05251-x.
4
PopPhy-CNN: A Phylogenetic Tree Embedded Architecture for Convolutional Neural Networks to Predict Host Phenotype From Metagenomic Data.PopPhy-CNN:一种将系统发生树嵌入到卷积神经网络中的架构,用于从宏基因组数据中预测宿主表型。
IEEE J Biomed Health Inform. 2020 Oct;24(10):2993-3001. doi: 10.1109/JBHI.2020.2993761. Epub 2020 May 11.
5
MegaR: an interactive R package for rapid sample classification and phenotype prediction using metagenome profiles and machine learning.MegaR:一个交互式 R 包,用于使用宏基因组谱和机器学习快速对样本进行分类和表型预测。
BMC Bioinformatics. 2021 Jan 18;22(1):25. doi: 10.1186/s12859-020-03933-4.
6
Evaluating metagenomics tools for genome binning with real metagenomic datasets and CAMI datasets.评估宏基因组工具在真实宏基因组数据集和 CAMI 数据集上的基因组 binning 效果。
BMC Bioinformatics. 2020 Jul 28;21(1):334. doi: 10.1186/s12859-020-03667-3.
7
A machine learning framework to determine geolocations from metagenomic profiling.基于宏基因组分析的地理位置确定机器学习框架。
Biol Direct. 2020 Nov 23;15(1):27. doi: 10.1186/s13062-020-00278-z.
8
Massive metagenomic data analysis using abundance-based machine learning.基于丰度的机器学习在海量宏基因组数据分析中的应用。
Biol Direct. 2019 Aug 1;14(1):12. doi: 10.1186/s13062-019-0242-0.
9
Phy-PMRFI: Phylogeny-Aware Prediction of Metagenomic Functions Using Random Forest Feature Importance.Phy-PMRFI:基于随机森林特征重要性的宏基因组功能预测的系统发育感知方法
IEEE Trans Nanobioscience. 2019 Jul;18(3):273-282. doi: 10.1109/TNB.2019.2912824. Epub 2019 Apr 24.
10
MetaPheno: A critical evaluation of deep learning and machine learning in metagenome-based disease prediction.MetaPheno:基于宏基因组的疾病预测中深度学习和机器学习的批判性评估。
Methods. 2019 Aug 15;166:74-82. doi: 10.1016/j.ymeth.2019.03.003. Epub 2019 Mar 16.

引用本文的文献

1
MicroHDF: predicting host phenotypes with metagenomic data using a deep forest-based framework.MicroHDF:基于深度森林框架利用宏基因组数据预测宿主表型。
Brief Bioinform. 2024 Sep 23;25(6). doi: 10.1093/bib/bbae530.