• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

蛋白质编码基因自动注释的当前方法。

Current methods for automated annotation of protein-coding genes.

作者信息

Hoff K J, Stanke M

机构信息

Institut für Mathematik und Informatik, Universität Greifswald, Walther-Rathenau-Str. 47, 17487 Greifswald, Germany.

出版信息

Curr Opin Insect Sci. 2015 Feb;7:8-14. doi: 10.1016/j.cois.2015.02.008. Epub 2015 Mar 7.

DOI:10.1016/j.cois.2015.02.008
PMID:32846689
Abstract

We review software tools for gene prediction - the identification of protein-coding genes and their structure in genome sequences. The discussed approaches include methods based on RNA-Seq and current methods based on homology - comparative gene prediction and protein spliced alignments. Many methods require that their parameters are adjusted to the target species or its broader clade. These include ab initio gene finders, integrated approaches with ab initio components and some aligners. We also review current automatic methods for training for the common case that a bona fide training set of gene structures is not available before annotation.

摘要

我们回顾了用于基因预测的软件工具——即在基因组序列中识别蛋白质编码基因及其结构。所讨论的方法包括基于RNA测序的方法以及当前基于同源性的方法——比较基因预测和蛋白质剪接比对。许多方法要求将其参数调整至目标物种或其更广泛的进化枝。这些方法包括从头开始的基因预测工具、带有从头开始组件的综合方法以及一些比对工具。我们还回顾了当前在注释之前没有真正的基因结构训练集这种常见情况下的自动训练方法。

相似文献

1
Current methods for automated annotation of protein-coding genes.蛋白质编码基因自动注释的当前方法。
Curr Opin Insect Sci. 2015 Feb;7:8-14. doi: 10.1016/j.cois.2015.02.008. Epub 2015 Mar 7.
2
CodingQuarry: highly accurate hidden Markov model gene prediction in fungal genomes using RNA-seq transcripts.CodingQuarry:利用RNA测序转录本对真菌基因组进行高精度隐马尔可夫模型基因预测。
BMC Genomics. 2015 Mar 11;16(1):170. doi: 10.1186/s12864-015-1344-4.
3
Combining RNA-seq data and homology-based gene prediction for plants, animals and fungi.将 RNA-seq 数据与基于同源性的基因预测相结合,用于植物、动物和真菌。
BMC Bioinformatics. 2018 May 30;19(1):189. doi: 10.1186/s12859-018-2203-5.
4
Evaluating high-throughput ab initio gene finders to discover proteins encoded in eukaryotic pathogen genomes missed by laboratory techniques.评估高通量从头基因预测软件,以发现实验室技术遗漏的真核病原体基因组编码的蛋白质。
PLoS One. 2012;7(11):e50609. doi: 10.1371/journal.pone.0050609. Epub 2012 Nov 30.
5
Comparative genomics in cyprinids: common carp ESTs help the annotation of the zebrafish genome.鲤科鱼类的比较基因组学:鲤鱼EST有助于斑马鱼基因组的注释。
BMC Bioinformatics. 2006 Dec 18;7 Suppl 5(Suppl 5):S2. doi: 10.1186/1471-2105-7-S5-S2.
6
Predicting Genes in Single Genomes with AUGUSTUS.使用AUGUSTUS预测单基因组中的基因。
Curr Protoc Bioinformatics. 2019 Mar;65(1):e57. doi: 10.1002/cpbi.57. Epub 2018 Nov 22.
7
[Analysis, identification and correction of some errors of model refseqs appeared in NCBI Human Gene Database by in silico cloning and experimental verification of novel human genes].[通过新型人类基因的电子克隆和实验验证对NCBI人类基因数据库中出现的模型参考序列的一些错误进行分析、鉴定和校正]
Yi Chuan Xue Bao. 2004 May;31(5):431-43.
8
Structural annotation of equine protein-coding genes determined by mRNA sequencing.通过mRNA测序确定的马蛋白质编码基因的结构注释。
Anim Genet. 2010 Dec;41 Suppl 2:121-30. doi: 10.1111/j.1365-2052.2010.02118.x.
9
AUGUSTUS at EGASP: using EST, protein and genomic alignments for improved gene prediction in the human genome.EGASP中的AUGUSTUS:利用EST、蛋白质和基因组比对改进人类基因组中的基因预测
Genome Biol. 2006;7 Suppl 1(Suppl 1):S11.1-8. doi: 10.1186/gb-2006-7-s1-s11. Epub 2006 Aug 7.
10
Integrative structural annotation of de novo RNA-Seq provides an accurate reference gene set of the enormous genome of the onion (Allium cepa L.).从头RNA测序的整合结构注释为洋葱(Allium cepa L.)庞大的基因组提供了一个准确的参考基因集。
DNA Res. 2015 Feb;22(1):19-27. doi: 10.1093/dnares/dsu035. Epub 2014 Oct 31.

引用本文的文献

1
Manual correction of genome annotation improved alternative splicing identification of Artemisia annua.人工修正基因组注释提高了黄花蒿可变剪接识别。
Planta. 2023 Sep 18;258(4):83. doi: 10.1007/s00425-023-04237-6.
2
The state of Medusozoa genomics: current evidence and future challenges.后生动物基因组学的现状:当前的证据和未来的挑战。
Gigascience. 2022 May 17;11. doi: 10.1093/gigascience/giac036.
3
Green plant genomes: What we know in an era of rapidly expanding opportunities.绿色植物基因组:在机遇迅速扩展的时代,我们所知道的。
Proc Natl Acad Sci U S A. 2022 Jan 25;119(4). doi: 10.1073/pnas.2115640118.
4
ReGSP: a visualized application for homology-based gene searching and plotting using multiple reference sequences.ReGSP:一种使用多个参考序列进行基于同源性的基因搜索和绘图的可视化应用程序。
PeerJ. 2021 Dec 23;9:e12707. doi: 10.7717/peerj.12707. eCollection 2021.
5
Automatic Prediction and Annotation: There Are Strong Biases for Multigenic Families.自动预测与注释:多基因家族存在强烈偏差。
Front Genet. 2021 Sep 16;12:697477. doi: 10.3389/fgene.2021.697477. eCollection 2021.
6
MakeHub: Fully Automated Generation of UCSC Genome Browser Assembly Hubs.MakeHub:全自动生成 UCSC 基因组浏览器组装中心。
Genomics Proteomics Bioinformatics. 2019 Oct;17(5):546-549. doi: 10.1016/j.gpb.2019.05.003. Epub 2020 Jan 28.
7
Tandem repeats lead to sequence assembly errors and impose multi-level challenges for genome and protein databases.串联重复导致序列组装错误,并对基因组和蛋白质数据库提出了多层次的挑战。
Nucleic Acids Res. 2019 Dec 2;47(21):10994-11006. doi: 10.1093/nar/gkz841.
8
Whole-Genome Alignment and Comparative Annotation.全基因组比对和注释。
Annu Rev Anim Biosci. 2019 Feb 15;7:41-64. doi: 10.1146/annurev-animal-020518-115005. Epub 2018 Oct 31.
9
Comparative Annotation Toolkit (CAT)-simultaneous clade and personal genome annotation.比较注释工具包 (CAT)-同时进行进化枝和个人基因组注释。
Genome Res. 2018 Jul;28(7):1029-1038. doi: 10.1101/gr.233460.117. Epub 2018 Jun 8.
10
Simultaneous gene finding in multiple genomes.在多个基因组中同时进行基因发现。
Bioinformatics. 2016 Nov 15;32(22):3388-3395. doi: 10.1093/bioinformatics/btw494. Epub 2016 Jul 27.