• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

RNAcode:在比较序列数据中稳健地区分编码和非编码区域。

RNAcode: robust discrimination of coding and noncoding regions in comparative sequence data.

机构信息

EMBL-European Bioinformatics Institute, Wellcome Trust Genome Campus, Hinxton, Cambridgeshire CB101SD, United Kingdom.

出版信息

RNA. 2011 Apr;17(4):578-94. doi: 10.1261/rna.2536111. Epub 2011 Feb 28.

DOI:10.1261/rna.2536111
PMID:21357752
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3062170/
Abstract

With the availability of genome-wide transcription data and massive comparative sequencing, the discrimination of coding from noncoding RNAs and the assessment of coding potential in evolutionarily conserved regions arose as a core analysis task. Here we present RNAcode, a program to detect coding regions in multiple sequence alignments that is optimized for emerging applications not covered by current protein gene-finding software. Our algorithm combines information from nucleotide substitution and gap patterns in a unified framework and also deals with real-life issues such as alignment and sequencing errors. It uses an explicit statistical model with no machine learning component and can therefore be applied "out of the box," without any training, to data from all domains of life. We describe the RNAcode method and apply it in combination with mass spectrometry experiments to predict and confirm seven novel short peptides in Escherichia coli and to analyze the coding potential of RNAs previously annotated as "noncoding." RNAcode is open source software and available for all major platforms at http://wash.github.com/rnacode.

摘要

随着全基因组转录数据和大规模比较测序的出现,区分编码 RNA 和非编码 RNA,以及评估进化保守区域的编码潜力成为了核心分析任务。在这里,我们介绍了 RNAcode,这是一种用于在多重序列比对中检测编码区域的程序,它针对当前蛋白质基因发现软件未涵盖的新兴应用进行了优化。我们的算法将核苷酸替换和空位模式的信息结合在一个统一的框架中,还处理了对齐和测序错误等实际问题。它使用一个没有机器学习组件的显式统计模型,因此可以“开箱即用”,无需任何训练,即可应用于来自生命所有领域的数据。我们描述了 RNAcode 方法,并将其与质谱实验结合使用,以预测和确认大肠杆菌中的七个新的短肽,并分析以前注释为“非编码”的 RNA 的编码潜力。RNAcode 是开源软件,可在所有主要平台上使用,网址为 http://wash.github.com/rnacode。

相似文献

1
RNAcode: robust discrimination of coding and noncoding regions in comparative sequence data.RNAcode:在比较序列数据中稳健地区分编码和非编码区域。
RNA. 2011 Apr;17(4):578-94. doi: 10.1261/rna.2536111. Epub 2011 Feb 28.
2
RNAcode_Web - Convenient identification of evolutionary conserved protein coding regions.RNAcode_Web——方便鉴定进化保守的蛋白质编码区。
J Integr Bioinform. 2023 Aug 25;20(3). doi: 10.1515/jib-2022-0046. eCollection 2023 Sep 1.
3
MASTR: multiple alignment and structure prediction of non-coding RNAs using simulated annealing.MASTR:使用模拟退火算法进行非编码RNA的多序列比对和结构预测
Bioinformatics. 2007 Dec 15;23(24):3304-11. doi: 10.1093/bioinformatics/btm525. Epub 2007 Nov 15.
4
RILogo: visualizing RNA-RNA interactions.RILogo:可视化 RNA-RNA 相互作用。
Bioinformatics. 2012 Oct 1;28(19):2523-6. doi: 10.1093/bioinformatics/bts461. Epub 2012 Jul 23.
5
Protein-coding structured RNAs: A computational survey of conserved RNA secondary structures overlapping coding regions in drosophilids.蛋白质编码的结构 RNA:对果蝇中编码区域重叠的保守 RNA 二级结构的计算调查。
Biochimie. 2011 Nov;93(11):2019-23. doi: 10.1016/j.biochi.2011.07.023. Epub 2011 Jul 31.
6
PETcofold: predicting conserved interactions and structures of two multiple alignments of RNA sequences.PETcofold:预测 RNA 序列两个多重比对的保守相互作用和结构。
Bioinformatics. 2011 Jan 15;27(2):211-9. doi: 10.1093/bioinformatics/btq634. Epub 2010 Nov 18.
7
Annotating non-coding RNAs with Rfam.使用Rfam注释非编码RNA。
Curr Protoc Bioinformatics. 2005 Apr;Chapter 12:12.5.1-12.5.12. doi: 10.1002/0471250953.bi1205s9.
8
ddbRNA: detection of conserved secondary structures in multiple alignments.ddbRNA:在多重比对中检测保守二级结构
Bioinformatics. 2003 Sep 1;19(13):1606-11. doi: 10.1093/bioinformatics/btg229.
9
NcDNAlign: plausible multiple alignments of non-protein-coding genomic sequences.NcDNAlign:非蛋白质编码基因组序列的合理多重比对。
Genomics. 2008 Jul;92(1):65-74. doi: 10.1016/j.ygeno.2008.04.003. Epub 2008 Jun 3.
10
Identification of protein coding regions in RNA transcripts.RNA转录本中蛋白质编码区域的鉴定。
Nucleic Acids Res. 2015 Jul 13;43(12):e78. doi: 10.1093/nar/gkv227. Epub 2015 Apr 13.

引用本文的文献

1
LncRNA-Encoded Micropeptides: Expression Validation, Translational Mechanisms, and Roles in Cellular Metabolism.长链非编码RNA编码的微肽:表达验证、翻译机制及其在细胞代谢中的作用
Int J Mol Sci. 2025 Jun 19;26(12):5913. doi: 10.3390/ijms26125913.
2
Popcorn: prediction of short coding and noncoding genomic sequences in prokaryotes.爆米花:原核生物中短编码和非编码基因组序列的预测
Bioinformatics. 2025 May 6;41(5). doi: 10.1093/bioinformatics/btaf250.
3
The hidden bacterial microproteome.隐藏的细菌微蛋白质组
Mol Cell. 2025 Mar 6;85(5):1024-1041.e6. doi: 10.1016/j.molcel.2025.01.025. Epub 2025 Feb 19.
4
A catalog of small proteins from the global microbiome.全球微生物组中的小分子蛋白质目录。
Nat Commun. 2024 Aug 31;15(1):7563. doi: 10.1038/s41467-024-51894-6.
5
Current understanding of functional peptides encoded by lncRNA in cancer.目前对lncRNA编码的功能性肽在癌症中的理解。
Cancer Cell Int. 2024 Jul 19;24(1):252. doi: 10.1186/s12935-024-03446-7.
6
The Cryptic Bacterial Microproteome.神秘的细菌微蛋白质组
bioRxiv. 2024 Feb 18:2024.02.17.580829. doi: 10.1101/2024.02.17.580829.
7
Discovery of antimicrobial peptides in the global microbiome with machine learning.利用机器学习在全球微生物组中发现抗菌肽。
Cell. 2024 Jul 11;187(14):3761-3778.e16. doi: 10.1016/j.cell.2024.05.013. Epub 2024 Jun 5.
8
Evolutionary Structure Conservation and Covariance Scores.进化结构保守性和协变分数。
Methods Mol Biol. 2024;2726:255-284. doi: 10.1007/978-1-0716-3519-3_11.
9
Challenges in computational discovery of bioactive peptides in 'omics data.在组学数据中计算发现生物活性肽的挑战。
Proteomics. 2024 Jun;24(12-13):e2300105. doi: 10.1002/pmic.202300105. Epub 2024 Mar 8.
10
Functional and evolutionary significance of unknown genes from uncultivated taxa.未培养分类群中未知基因的功能和进化意义。
Nature. 2024 Feb;626(7998):377-384. doi: 10.1038/s41586-023-06955-z. Epub 2023 Dec 18.

本文引用的文献

1
Optimization of parameters for coverage of low molecular weight proteins.优化覆盖低分子量蛋白质的参数。
Anal Bioanal Chem. 2010 Dec;398(7-8):2867-81. doi: 10.1007/s00216-010-4093-x. Epub 2010 Aug 28.
2
Small peptides switch the transcriptional activity of Shavenbaby during Drosophila embryogenesis.小分子肽在果蝇胚胎发生过程中改变 Shavenbaby 的转录活性。
Science. 2010 Jul 16;329(5989):336-9. doi: 10.1126/science.1188158.
3
Molecular biology. Hiding in plain sight.分子生物学。隐藏于众目睽睽之下。
Science. 2010 Jul 16;329(5989):284-5. doi: 10.1126/science.1192769.
4
A dual-function sRNA from B. subtilis: SR1 acts as a peptide encoding mRNA on the gapA operon.枯草芽孢杆菌中的一种双功能 sRNA:SR1 作为 gapA 操纵子上的编码肽的 mRNA 发挥作用。
Mol Microbiol. 2010 May;76(4):990-1009. doi: 10.1111/j.1365-2958.2010.07158.x. Epub 2010 Apr 1.
5
RNAz 2.0: improved noncoding RNA detection.RNAz 2.0:改进的非编码RNA检测
Pac Symp Biocomput. 2010:69-79.
6
The transcription unit architecture of the Escherichia coli genome.大肠杆菌基因组的转录单元结构。
Nat Biotechnol. 2009 Nov;27(11):1043-9. doi: 10.1038/nbt.1582. Epub 2009 Nov 1.
7
The Universal Protein Resource (UniProt) in 2010.2010 年的通用蛋白质资源(UniProt)。
Nucleic Acids Res. 2010 Jan;38(Database issue):D142-8. doi: 10.1093/nar/gkp846. Epub 2009 Oct 20.
8
Identification of candidate structured RNAs in the marine organism 'Candidatus Pelagibacter ubique'.在海洋生物“嗜盐栖热袍菌(暂定名)”中鉴定候选结构化RNA
BMC Genomics. 2009 Jun 16;10:268. doi: 10.1186/1471-2164-10-268.
9
Metatranscriptomics reveals unique microbial small RNAs in the ocean's water column.宏转录组学揭示了海洋水柱中独特的微生物小RNA。
Nature. 2009 May 14;459(7244):266-9. doi: 10.1038/nature08055.
10
Small membrane proteins found by comparative genomics and ribosome binding site models.通过比较基因组学和核糖体结合位点模型发现的小膜蛋白。
Mol Microbiol. 2008 Dec;70(6):1487-501. doi: 10.1111/j.1365-2958.2008.06495.x.