• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

NMPFamsDB:一个从微生物宏基因组和宏转录组中挖掘新型蛋白家族的数据库。

NMPFamsDB: a database of novel protein families from microbial metagenomes and metatranscriptomes.

机构信息

Institute for Fundamental Biomedical Research, BSRC "Alexander Fleming", Vari, 16672, Greece.

John Harvard Distinguished Science Fellowship Program, Harvard University, Cambridge, MA 02138, USA.

出版信息

Nucleic Acids Res. 2024 Jan 5;52(D1):D502-D512. doi: 10.1093/nar/gkad800.

DOI:10.1093/nar/gkad800
PMID:37811892
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10767849/
Abstract

The Novel Metagenome Protein Families Database (NMPFamsDB) is a database of metagenome- and metatranscriptome-derived protein families, whose members have no hits to proteins of reference genomes or Pfam domains. Each protein family is accompanied by multiple sequence alignments, Hidden Markov Models, taxonomic information, ecosystem and geolocation metadata, sequence and structure predictions, as well as 3D structure models predicted with AlphaFold2. In its current version, NMPFamsDB hosts over 100 000 protein families, each with at least 100 members. The reported protein families significantly expand (more than double) the number of known protein sequence clusters from reference genomes and reveal new insights into their habitat distribution, origins, functions and taxonomy. We expect NMPFamsDB to be a valuable resource for microbial proteome-wide analyses and for further discovery and characterization of novel functions. NMPFamsDB is publicly available in http://www.nmpfamsdb.org/ or https://bib.fleming.gr/NMPFamsDB.

摘要

新型宏基因组蛋白家族数据库(NMPFamsDB)是一个宏基因组和宏转录组衍生的蛋白家族数据库,其成员与参考基因组或 Pfam 结构域的蛋白没有匹配。每个蛋白家族都附有多个序列比对、隐马尔可夫模型、分类学信息、生态系统和地理位置元数据、序列和结构预测,以及使用 AlphaFold2 预测的 3D 结构模型。在当前版本中,NMPFamsDB 拥有超过 100000 个蛋白家族,每个家族至少有 100 个成员。报告的蛋白家族显著扩展了(超过两倍)来自参考基因组的已知蛋白序列簇的数量,并揭示了它们的栖息地分布、起源、功能和分类学的新见解。我们预计 NMPFamsDB 将成为微生物全蛋白组分析以及进一步发现和描述新功能的有价值资源。NMPFamsDB 可在 http://www.nmpfamsdb.org/ 或 https://bib.fleming.gr/NMPFamsDB 上公开获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/5b0a199bbe7e/gkad800fig5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/56a197bd38f1/gkad800figgra1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/f97b41b493e4/gkad800fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/a4a02bfe0c78/gkad800fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/fc471a0b21bf/gkad800fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/e920cb65e09a/gkad800fig4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/5b0a199bbe7e/gkad800fig5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/56a197bd38f1/gkad800figgra1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/f97b41b493e4/gkad800fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/a4a02bfe0c78/gkad800fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/fc471a0b21bf/gkad800fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/e920cb65e09a/gkad800fig4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d1b/10767849/5b0a199bbe7e/gkad800fig5.jpg

相似文献

1
NMPFamsDB: a database of novel protein families from microbial metagenomes and metatranscriptomes.NMPFamsDB:一个从微生物宏基因组和宏转录组中挖掘新型蛋白家族的数据库。
Nucleic Acids Res. 2024 Jan 5;52(D1):D502-D512. doi: 10.1093/nar/gkad800.
2
Unraveling the functional dark matter through global metagenomics.通过全球宏基因组学揭示功能暗物质。
Nature. 2023 Oct;622(7983):594-602. doi: 10.1038/s41586-023-06583-7. Epub 2023 Oct 11.
3
The Pfam protein families database.Pfam蛋白质家族数据库。
Nucleic Acids Res. 2002 Jan 1;30(1):276-80. doi: 10.1093/nar/30.1.276.
4
SUPFAM--a database of potential protein superfamily relationships derived by comparing sequence-based and structure-based families: implications for structural genomics and function annotation in genomes.SUPFAM——一个通过比较基于序列和基于结构的家族而得出的潜在蛋白质超家族关系数据库:对结构基因组学和基因组功能注释的意义。
Nucleic Acids Res. 2002 Jan 1;30(1):289-93. doi: 10.1093/nar/30.1.289.
5
The Pfam protein families database.Pfam蛋白质家族数据库。
Nucleic Acids Res. 2000 Jan 1;28(1):263-6. doi: 10.1093/nar/28.1.263.
6
Pfam: multiple sequence alignments and HMM-profiles of protein domains.Pfam:蛋白质结构域的多序列比对和隐马尔可夫模型概况
Nucleic Acids Res. 1998 Jan 1;26(1):320-2. doi: 10.1093/nar/26.1.320.
7
Pfam 3.1: 1313 multiple alignments and profile HMMs match the majority of proteins.Pfam 3.1:1313个多重比对和隐马尔可夫模型概况与大多数蛋白质匹配。
Nucleic Acids Res. 1999 Jan 1;27(1):260-2. doi: 10.1093/nar/27.1.260.
8
TerrestrialMetagenomeDB: a public repository of curated and standardized metadata for terrestrial metagenomes.陆地宏基因组数据库:一个经过策展和标准化的陆地宏基因组元数据公共存储库。
Nucleic Acids Res. 2020 Jan 8;48(D1):D626-D632. doi: 10.1093/nar/gkz994.
9
The Pfam protein families database.Pfam蛋白质家族数据库。
Nucleic Acids Res. 2008 Jan;36(Database issue):D281-8. doi: 10.1093/nar/gkm960. Epub 2007 Nov 26.
10
Identifying protein domains with the Pfam database.使用Pfam数据库识别蛋白质结构域。
Curr Protoc Bioinformatics. 2003 May;Chapter 2:Unit 2.5. doi: 10.1002/0471250953.bi0205s01.

引用本文的文献

1
DSSP 4: FAIR annotation of protein secondary structure.DSSP 4:蛋白质二级结构的公平注释。
Protein Sci. 2025 Aug;34(8):e70208. doi: 10.1002/pro.70208.
2
Annotating the microbial dark matter with HiFi-NN.用HiFi-NN注释微生物暗物质。
iScience. 2025 Apr 18;28(6):112480. doi: 10.1016/j.isci.2025.112480. eCollection 2025 Jun 20.
3
A catalog of small proteins from the global microbiome.全球微生物组中的小分子蛋白质目录。

本文引用的文献

1
Functional repertoire convergence of distantly related eukaryotic plankton lineages abundant in the sunlit ocean.阳光照射的海洋中丰富的远缘真核浮游生物谱系的功能库趋同。
Cell Genom. 2022 Apr 28;2(5):100123. doi: 10.1016/j.xgen.2022.100123. eCollection 2022 May 11.
2
MGnify: the microbiome sequence data analysis resource in 2023.MGnify:2023 年的微生物组序列数据分析资源。
Nucleic Acids Res. 2023 Jan 6;51(D1):D753-D759. doi: 10.1093/nar/gkac1080.
3
The IMG/M data management and analysis system v.7: content updates and new features.
Nat Commun. 2024 Aug 31;15(1):7563. doi: 10.1038/s41467-024-51894-6.
4
Genome-resolved metagenomics: a game changer for microbiome medicine.基因组解析宏基因组学:微生物组医学的变革者。
Exp Mol Med. 2024 Jul;56(7):1501-1512. doi: 10.1038/s12276-024-01262-7. Epub 2024 Jul 1.
5
Visualizing metagenomic and metatranscriptomic data: A comprehensive review.宏基因组学和宏转录组学数据的可视化:全面综述
Comput Struct Biotechnol J. 2024 May 3;23:2011-2033. doi: 10.1016/j.csbj.2024.04.060. eCollection 2024 Dec.
6
The 2024 Nucleic Acids Research database issue and the online molecular biology database collection.2024 年核酸研究数据库问题及在线分子生物学数据库收藏。
Nucleic Acids Res. 2024 Jan 5;52(D1):D1-D9. doi: 10.1093/nar/gkad1173.
IMG/M 数据管理与分析系统 v.7:内容更新与新特性。
Nucleic Acids Res. 2023 Jan 6;51(D1):D723-D732. doi: 10.1093/nar/gkac976.
4
InterPro in 2022.InterPro 在 2022 年。
Nucleic Acids Res. 2023 Jan 6;51(D1):D418-D427. doi: 10.1093/nar/gkac993.
5
Twenty-five years of Genomes OnLine Database (GOLD): data updates and new features in v.9.25 年的基因组在线数据库(GOLD):v.9 中的数据更新和新功能。
Nucleic Acids Res. 2023 Jan 6;51(D1):D957-D963. doi: 10.1093/nar/gkac974.
6
Whokaryote: distinguishing eukaryotic and prokaryotic contigs in metagenomes based on gene structure.WhoKaryote:基于基因结构区分宏基因组中的真核生物和原核生物序列。
Microb Genom. 2022 May;8(5). doi: 10.1099/mgen.0.000823.
7
Improved prediction of protein-protein interactions using AlphaFold2.利用 AlphaFold2 提高蛋白质-蛋白质相互作用预测的准确性。
Nat Commun. 2022 Mar 10;13(1):1265. doi: 10.1038/s41467-022-28865-w.
8
SignalP 6.0 predicts all five types of signal peptides using protein language models.SignalP 6.0 使用蛋白质语言模型预测所有五种类型的信号肽。
Nat Biotechnol. 2022 Jul;40(7):1023-1025. doi: 10.1038/s41587-021-01156-3. Epub 2022 Jan 3.
9
SCOPe: improvements to the structural classification of proteins - extended database to facilitate variant interpretation and machine learning.SCOPe:蛋白质结构分类的改进——扩展数据库以促进变体解释和机器学习。
Nucleic Acids Res. 2022 Jan 7;50(D1):D553-D559. doi: 10.1093/nar/gkab1054.
10
Identifying viruses from metagenomic data using deep learning.利用深度学习从宏基因组数据中识别病毒。
Quant Biol. 2020 Mar;8(1):64-77. doi: 10.1007/s40484-019-0187-4.