• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CompoDynamics:用于描述序列组成动态的综合数据库。

CompoDynamics: a comprehensive database for characterizing sequence composition dynamics.

机构信息

National Genomics Data Center & CAS Key Laboratory of Genome Sciences and Information, Beijing Institute of Genomics, Chinese Academy of Sciences, Beijing 100101, China.

China National Center for Bioinformation, Beijing 100101, China.

出版信息

Nucleic Acids Res. 2022 Jan 7;50(D1):D962-D969. doi: 10.1093/nar/gkab979.

DOI:10.1093/nar/gkab979
PMID:34718745
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8728180/
Abstract

Sequence compositions of nucleic acids and proteins have significant impact on gene expression, RNA stability, translation efficiency, RNA/protein structure and molecular function, and are associated with genome evolution and adaptation across all kingdoms of life. Therefore, a devoted resource of sequence compositions and associated features is fundamentally crucial for a wide range of biological research. Here, we present CompoDynamics (https://ngdc.cncb.ac.cn/compodynamics/), a comprehensive database of sequence compositions of coding sequences (CDSs) and genomes for all kinds of species. Taking advantage of the exponential growth of RefSeq data, CompoDynamics presents a wealth of sequence compositions (nucleotide content, codon usage, amino acid usage) and derived features (coding potential, physicochemical property and phase separation) for 118 689 747 high-quality CDSs and 34 562 genomes across 24 995 species. Additionally, interactive analytical tools are provided to enable comparative analyses of sequence compositions and molecular features across different species and gene groups. Collectively, CompoDynamics bears the great potential to better understand the underlying roles of sequence composition dynamics across genes and genomes, providing a fundamental resource in support of a broad spectrum of biological studies.

摘要

核酸和蛋白质的序列组成对基因表达、RNA 稳定性、翻译效率、RNA/蛋白质结构和分子功能有重要影响,并与所有生命领域的基因组进化和适应有关。因此,专门的序列组成和相关特征资源对于广泛的生物学研究至关重要。在这里,我们介绍 CompoDynamics(https://ngdc.cncb.ac.cn/compodynamics/),这是一个包含所有物种编码序列(CDS)和基因组序列组成的综合数据库。利用 RefSeq 数据的指数增长,CompoDynamics 为 24995 个物种的 118689747 个高质量 CDS 和 34562 个基因组提供了丰富的序列组成(核苷酸含量、密码子使用、氨基酸使用)和衍生特征(编码潜力、理化性质和相分离)。此外,还提供了交互式分析工具,可用于比较不同物种和基因组之间的序列组成和分子特征。总之,CompoDynamics 具有更好地理解基因和基因组中序列组成动态的巨大潜力,为广泛的生物学研究提供了基本资源支持。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/ba8e2fa9b6c6/gkab979fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/65f45d5e5370/gkab979fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/233b60de3233/gkab979fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/ba8e2fa9b6c6/gkab979fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/65f45d5e5370/gkab979fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/233b60de3233/gkab979fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cad4/8728180/ba8e2fa9b6c6/gkab979fig3.jpg

相似文献

1
CompoDynamics: a comprehensive database for characterizing sequence composition dynamics.CompoDynamics:用于描述序列组成动态的综合数据库。
Nucleic Acids Res. 2022 Jan 7;50(D1):D962-D969. doi: 10.1093/nar/gkab979.
2
Eukaryotic tRNAs fingerprint invertebrates vis-à-vis vertebrates.真核 tRNA 在无脊椎动物与脊椎动物之间具有特征指纹。
J Biomol Struct Dyn. 2015;33(10):2104-20. doi: 10.1080/07391102.2014.990925. Epub 2015 Jan 12.
3
Codon Usage Optimization in the Prokaryotic Tree of Life: How Synonymous Codons Are Differentially Selected in Sequence Domains with Different Expression Levels and Degrees of Conservation.原核生物树中的密码子使用优化:具有不同表达水平和不同保守程度的序列结构域中如何差异选择同义密码子。
mBio. 2020 Jul 21;11(4):e00766-20. doi: 10.1128/mBio.00766-20.
4
Toward automatic reconstruction of a highly resolved tree of life.迈向高分辨率生命树的自动重建。
Science. 2006 Mar 3;311(5765):1283-7. doi: 10.1126/science.1123061.
5
Codon use and aversion is largely phylogenetically conserved across the tree of life.密码子的使用和偏好在整个生命之树上在很大程度上是系统发育保守的。
Mol Phylogenet Evol. 2020 Mar;144:106697. doi: 10.1016/j.ympev.2019.106697. Epub 2019 Dec 2.
6
Phylogenetic signal in the eukaryotic tree of life.真核生物生命之树中的系统发育信号。
Science. 2008 Jul 4;321(5885):121-3. doi: 10.1126/science.1154449.
7
The majority of long non-stop reading frames on the antisense strand can be explained by biased codon usage.反义链上大多数长的不间断阅读框可以用密码子使用偏好来解释。
Gene. 1997 Jul 18;194(1):143-55. doi: 10.1016/s0378-1119(97)00199-6.
8
Comparison of RefSeq protein-coding regions in human and vertebrate genomes.比较人类和脊椎动物基因组中的 RefSeq 编码蛋白区域。
BMC Genomics. 2013 Sep 25;14:654. doi: 10.1186/1471-2164-14-654.
9
The fundamental tradeoff in genomes and proteomes of prokaryotes established by the genetic code, codon entropy, and physics of nucleic acids and proteins.由遗传密码、密码子熵以及核酸和蛋白质的物理学所确立的原核生物基因组和蛋白质组中的基本权衡。
Biol Direct. 2014 Dec 12;9:29. doi: 10.1186/s13062-014-0029-2.
10
The OMA orthology database in 2018: retrieving evolutionary relationships among all domains of life through richer web and programmatic interfaces.2018 年的 OMA 同源数据库:通过更丰富的网络和编程接口检索所有生命领域之间的进化关系。
Nucleic Acids Res. 2018 Jan 4;46(D1):D477-D485. doi: 10.1093/nar/gkx1019.

引用本文的文献

1
Compositional features analysis by machine learning in genome represents linear adaptation of monkeypox virus.通过机器学习对基因组进行的组成特征分析代表了猴痘病毒的线性适应。
Front Genet. 2024 Mar 1;15:1361952. doi: 10.3389/fgene.2024.1361952. eCollection 2024.
2
Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2024.2024 年中国国家生物信息中心国家基因组学数据中心的数据库资源。
Nucleic Acids Res. 2024 Jan 5;52(D1):D18-D32. doi: 10.1093/nar/gkad1078.
3
Risk Assessment of the Possible Intermediate Host Role of Pigs for Coronaviruses with a Deep Learning Predictor.

本文引用的文献

1
Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2023.2023 年中国国家生物信息中心国家基因组学数据中心数据库资源。
Nucleic Acids Res. 2023 Jan 6;51(D1):D18-D28. doi: 10.1093/nar/gkac1073.
2
Nucleotide Composition and Codon Usage Across Viruses and Their Respective Hosts.病毒及其各自宿主的核苷酸组成与密码子使用情况
Front Microbiol. 2021 Jun 28;12:646300. doi: 10.3389/fmicb.2021.646300. eCollection 2021.
3
Genome Warehouse: A Public Repository Housing Genome-scale Data.基因组仓库:一个存储基因组规模数据的公共存储库。
利用深度学习预测器评估猪作为冠状病毒中间宿主的可能性风险。
Viruses. 2023 Jul 15;15(7):1556. doi: 10.3390/v15071556.
4
Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2023.2023 年中国国家生物信息中心国家基因组学数据中心数据库资源。
Nucleic Acids Res. 2023 Jan 6;51(D1):D18-D28. doi: 10.1093/nar/gkac1073.
5
Deep learning based on biologically interpretable genome representation predicts two types of human adaptation of SARS-CoV-2 variants.基于具有生物学可解释性的基因组表示的深度学习预测了 SARS-CoV-2 变体的两种人类适应类型。
Brief Bioinform. 2022 May 13;23(3). doi: 10.1093/bib/bbac036.
6
Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2022.2022 年中国国家生物信息中心国家基因组学数据中心数据库资源。
Nucleic Acids Res. 2022 Jan 7;50(D1):D27-D38. doi: 10.1093/nar/gkab951.
Genomics Proteomics Bioinformatics. 2021 Aug;19(4):584-589. doi: 10.1016/j.gpb.2021.04.001. Epub 2021 Jun 24.
4
Signatures of optimal codon usage in metabolic genes inform budding yeast ecology.代谢基因最优密码子使用特征为 budding yeast 生态学提供信息。
PLoS Biol. 2021 Apr 19;19(4):e3001185. doi: 10.1371/journal.pbio.3001185. eCollection 2021 Apr.
5
Gene regulation by long non-coding RNAs and its biological functions.长非编码 RNA 的基因调控及其生物学功能。
Nat Rev Mol Cell Biol. 2021 Feb;22(2):96-118. doi: 10.1038/s41580-020-00315-9. Epub 2020 Dec 22.
6
The Gene Ontology resource: enriching a GOld mine.基因本体论资源:丰富一个 GOld 矿。
Nucleic Acids Res. 2021 Jan 8;49(D1):D325-D334. doi: 10.1093/nar/gkaa1113.
7
Pfam: The protein families database in 2021.Pfam:2021 年的蛋白质家族数据库。
Nucleic Acids Res. 2021 Jan 8;49(D1):D412-D419. doi: 10.1093/nar/gkaa913.
8
CUBAP: an interactive web portal for analyzing codon usage biases across populations.CUBAP:一个用于分析群体间密码子使用偏倚的交互式网络门户。
Nucleic Acids Res. 2020 Nov 4;48(19):11030-11039. doi: 10.1093/nar/gkaa863.
9
NCBI Taxonomy: a comprehensive update on curation, resources and tools.NCBI 分类学:在管理、资源和工具方面的全面更新。
Database (Oxford). 2020 Jan 1;2020. doi: 10.1093/database/baaa062.
10
LLPSDB: a database of proteins undergoing liquid-liquid phase separation in vitro.LLPSDB:体外液-液相分离的蛋白质数据库。
Nucleic Acids Res. 2020 Jan 8;48(D1):D320-D327. doi: 10.1093/nar/gkz778.