• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

蛋白质编码序列的古老进化信号可用于发现果蝇基因组中的新基因。

Ancient evolutionary signals of protein-coding sequences allow the discovery of new genes in the Drosophila melanogaster genome.

机构信息

Centro Andaluz de Biologia del Desarrollo (CABD, UPO-CSIC-JA). Facultad de Ciencias Experimentales (Área de Genética), Universidad Pablo de Olavide, 41013, Sevilla, Spain.

出版信息

BMC Genomics. 2020 Mar 5;21(1):210. doi: 10.1186/s12864-020-6632-y.

DOI:10.1186/s12864-020-6632-y
PMID:32138644
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7059364/
Abstract

BACKGROUND

The current growth in DNA sequencing techniques makes of genome annotation a crucial task in the genomic era. Traditional gene finders focus on protein-coding sequences, but they are far from being exhaustive. The number of this kind of genes continuously increases due to new experimental data and development of improved bioinformatics algorithms.

RESULTS

In this context, AnABlast represents a novel in silico strategy, based on the accumulation of short evolutionary signals identified by protein sequence alignments of low score. This strategy potentially highlights protein-coding regions in genomic sequences regardless of traditional homology or translation signatures. Here, we analyze the evolutionary information that the accumulation of these short signals encloses. Using the Drosophila melanogaster genome, we stablish optimal parameters for the accurate gene prediction with AnABlast and show that this new strategy significantly contributes to add genes, exons and pseudogenes regions, yet to be discovered in both already annotated and new genomes.

CONCLUSIONS

AnABlast can be freely used to analyze genomic regions of whole genomes where it contributes to complete the previous annotation.

摘要

背景

当前 DNA 测序技术的发展使得基因组注释成为基因组时代的一项关键任务。传统的基因预测器专注于蛋白质编码序列,但它们远非详尽无遗。由于新的实验数据和改进的生物信息学算法的发展,这种基因的数量不断增加。

结果

在这种情况下,AnABlast 代表了一种新的基于低得分蛋白质序列比对中识别的短进化信号积累的计算策略。这种策略可以潜在地突出基因组序列中的蛋白质编码区域,而无需传统的同源性或翻译特征。在这里,我们分析了这些短信号积累所包含的进化信息。使用黑腹果蝇基因组,我们为 AnABlast 进行准确基因预测建立了最佳参数,并表明这种新策略显著有助于发现已经注释和新基因组中尚未发现的基因、外显子和假基因区域。

结论

AnABlast 可以自由用于分析整个基因组的基因组区域,有助于完成以前的注释。

相似文献

1
Ancient evolutionary signals of protein-coding sequences allow the discovery of new genes in the Drosophila melanogaster genome.蛋白质编码序列的古老进化信号可用于发现果蝇基因组中的新基因。
BMC Genomics. 2020 Mar 5;21(1):210. doi: 10.1186/s12864-020-6632-y.
2
AnABlast: Re-searching for Protein-Coding Sequences in Genomic Regions.AnABlast:在基因组区域中搜索蛋白质编码序列。
Methods Mol Biol. 2019;1962:207-214. doi: 10.1007/978-1-4939-9173-0_12.
3
AnABlast: a new in silico strategy for the genome-wide search of novel genes and fossil regions.AnABlast:一种用于全基因组搜索新基因和化石区域的新计算机策略。
DNA Res. 2015 Dec;22(6):439-49. doi: 10.1093/dnares/dsv025. Epub 2015 Oct 21.
4
Ab initio gene finding in Drosophila genomic DNA.在果蝇基因组DNA中进行从头基因预测。
Genome Res. 2000 Apr;10(4):516-22. doi: 10.1101/gr.10.4.516.
5
[Analysis, identification and correction of some errors of model refseqs appeared in NCBI Human Gene Database by in silico cloning and experimental verification of novel human genes].[通过新型人类基因的电子克隆和实验验证对NCBI人类基因数据库中出现的模型参考序列的一些错误进行分析、鉴定和校正]
Yi Chuan Xue Bao. 2004 May;31(5):431-43.
6
Discovery of high-confidence human protein-coding genes and exons by whole-genome PhyloCSF helps elucidate 118 GWAS loci.全基因组 PhyloCSF 发现高可信度的人类蛋白编码基因和外显子,有助于阐明 118 个 GWAS 基因座。
Genome Res. 2019 Dec;29(12):2073-2087. doi: 10.1101/gr.246462.118. Epub 2019 Sep 19.
7
Identification of unannotated exons of low abundance transcripts in Drosophila melanogaster and cloning of a new serine protease gene upregulated upon injury.黑腹果蝇中低丰度转录本未注释外显子的鉴定以及一个在损伤后上调的新丝氨酸蛋白酶基因的克隆。
BMC Genomics. 2007 Jul 24;8:249. doi: 10.1186/1471-2164-8-249.
8
Enrichment of transcriptional regulatory sites in non-coding genomic region.非编码基因组区域中转录调控位点的富集
Bioinformatics. 2004 Mar 1;20(4):569-75. doi: 10.1093/bioinformatics/btg450. Epub 2004 Jan 22.
9
Assessing the Drosophila melanogaster and Anopheles gambiae genome annotations using genome-wide sequence comparisons.利用全基因组序列比较评估黑腹果蝇和冈比亚按蚊的基因组注释。
Genome Res. 2003 Jul;13(7):1595-9. doi: 10.1101/gr.922503.
10
Comparison of complete nuclear receptor sets from the human, Caenorhabditis elegans and Drosophila genomes.人类、秀丽隐杆线虫和果蝇基因组中完整核受体集的比较。
Genome Biol. 2001;2(8):RESEARCH0029. doi: 10.1186/gb-2001-2-8-research0029. Epub 2001 Jul 24.

引用本文的文献

1
Using AnABlast for intergenic sORF prediction in the Caenorhabditis elegans genome.使用 AnABlast 预测秀丽隐杆线虫基因组中的基因间 sORF。
Bioinformatics. 2020 Dec 8;36(19):4827-4832. doi: 10.1093/bioinformatics/btaa608.

本文引用的文献

1
AnABlast: Re-searching for Protein-Coding Sequences in Genomic Regions.AnABlast:在基因组区域中搜索蛋白质编码序列。
Methods Mol Biol. 2019;1962:207-214. doi: 10.1007/978-1-4939-9173-0_12.
2
FlyBase 2.0: the next generation.FlyBase 2.0:下一代。
Nucleic Acids Res. 2019 Jan 8;47(D1):D759-D765. doi: 10.1093/nar/gky1003.
3
Coding and Non-coding RNAs, the Frontier Has Never Been So Blurred.编码RNA与非编码RNA,前沿界限从未如此模糊。
Front Genet. 2018 Apr 18;9:140. doi: 10.3389/fgene.2018.00140. eCollection 2018.
4
Classification and function of small open reading frames.小开放阅读框的分类与功能。
Nat Rev Mol Cell Biol. 2017 Sep;18(9):575-589. doi: 10.1038/nrm.2017.58. Epub 2017 Jul 12.
5
Twenty years of bacterial genome sequencing.二十年的细菌基因组测序。
Nat Rev Microbiol. 2015 Dec;13(12):787-94. doi: 10.1038/nrmicro3565. Epub 2015 Nov 9.
6
AnABlast: a new in silico strategy for the genome-wide search of novel genes and fossil regions.AnABlast:一种用于全基因组搜索新基因和化石区域的新计算机策略。
DNA Res. 2015 Dec;22(6):439-49. doi: 10.1093/dnares/dsv025. Epub 2015 Oct 21.
7
IPred - integrating ab initio and evidence based gene predictions to improve prediction accuracy.IPred——整合从头预测和基于证据的基因预测以提高预测准确性。
BMC Genomics. 2015 Feb 26;16(1):134. doi: 10.1186/s12864-015-1315-9.
8
UniRef clusters: a comprehensive and scalable alternative for improving sequence similarity searches.UniRef聚类:一种用于改进序列相似性搜索的全面且可扩展的替代方法。
Bioinformatics. 2015 Mar 15;31(6):926-32. doi: 10.1093/bioinformatics/btu739. Epub 2014 Nov 13.
9
Pseudogene redux with new biological significance.具有新生物学意义的假基因再现
Methods Mol Biol. 2014;1167:3-13. doi: 10.1007/978-1-4939-0835-6_1.
10
Evaluating high-throughput ab initio gene finders to discover proteins encoded in eukaryotic pathogen genomes missed by laboratory techniques.评估高通量从头基因预测软件,以发现实验室技术遗漏的真核病原体基因组编码的蛋白质。
PLoS One. 2012;7(11):e50609. doi: 10.1371/journal.pone.0050609. Epub 2012 Nov 30.