Suppr超能文献

小开放阅读框:当前的预测技术和未来展望。

Small open reading frames: current prediction techniques and future prospect.

机构信息

Indiana University School of Informatics, Indiana University-Purdue University and Center for Computational Biology and Bioinformatics, Indiana University School of Medicine, Indianapolis, IN 46202, USA.

出版信息

Curr Protein Pept Sci. 2011 Sep;12(6):503-7. doi: 10.2174/138920311796957667.

Abstract

Evidence is accumulating that small open reading frames (sORF, <100 codons) play key roles in many important biological processes. Yet, they are generally ignored in gene annotation despite they are far more abundant than the genes with more than 100 codons. Here, we demonstrate that popular homolog search and codon-index techniques perform poorly for small genes relative to that for larger genes, while a method dedicated to sORF discovery has a similar level of accuracy as homology search. The result is largely due to the small dataset of experimentally verified sORF available for homology search and for training ab initio techniques. It highlights the urgent need for both experimental and computational studies in order to further advance the accuracy of sORF prediction.

摘要

越来越多的证据表明,小开放阅读框(sORF,<100 个密码子)在许多重要的生物学过程中发挥着关键作用。然而,尽管它们的数量远远超过 100 个密码子的基因,但在基因注释中通常被忽略。在这里,我们证明相对于较大的基因,流行的同源搜索和密码子索引技术在小基因方面的性能较差,而专门用于发现 sORF 的方法的准确性与同源搜索相当。这一结果主要是由于用于同源搜索和从头预测技术训练的实验验证的 sORF 的小数据集。这突出表明需要进行实验和计算研究,以进一步提高 sORF 预测的准确性。

相似文献

引用本文的文献

2
Discovering the hidden function in fungal genomes.发现真菌基因组中的隐藏功能。
Nat Commun. 2024 Sep 19;15(1):8219. doi: 10.1038/s41467-024-52568-z.
3
LncRNA-encoded peptides in cancer.lncRNA 编码肽在癌症中的作用。
J Hematol Oncol. 2024 Aug 12;17(1):66. doi: 10.1186/s13045-024-01591-0.
5
No country for old methods: New tools for studying microproteins.旧方法的时代不再:研究微蛋白的新工具
iScience. 2024 Jan 20;27(2):108972. doi: 10.1016/j.isci.2024.108972. eCollection 2024 Feb 16.

本文引用的文献

3
5
Saccharomyces Genome Database provides mutant phenotype data.酿酒酵母基因组数据库提供了突变表型数据。
Nucleic Acids Res. 2010 Jan;38(Database issue):D433-6. doi: 10.1093/nar/gkp917. Epub 2009 Nov 11.
6
The Universal Protein Resource (UniProt) in 2010.2010 年的通用蛋白质资源(UniProt)。
Nucleic Acids Res. 2010 Jan;38(Database issue):D142-8. doi: 10.1093/nar/gkp846. Epub 2009 Oct 20.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验