• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
Self-identification of protein-coding regions in microbial genomes.微生物基因组中蛋白质编码区域的自我识别。
Proc Natl Acad Sci U S A. 1998 Aug 18;95(17):10026-31. doi: 10.1073/pnas.95.17.10026.
2
How to interpret an anonymous bacterial genome: machine learning approach to gene identification.如何解读匿名细菌基因组:用于基因识别的机器学习方法
Genome Res. 1998 Nov;8(11):1154-71. doi: 10.1101/gr.8.11.1154.
3
Prokaryotic gene prediction using GeneMark and GeneMark.hmm.使用GeneMark和GeneMark.hmm进行原核生物基因预测。
Curr Protoc Bioinformatics. 2003 May;Chapter 4:Unit4.5. doi: 10.1002/0471250953.bi0405s01.
4
Gene identification in novel eukaryotic genomes by self-training algorithm.基于自训练算法的新型真核生物基因组基因识别
Nucleic Acids Res. 2005 Nov 28;33(20):6494-506. doi: 10.1093/nar/gki937. Print 2005.
5
Detection of new genes in a bacterial genome using Markov models for three gene classes.使用马尔可夫模型针对三类基因在细菌基因组中检测新基因。
Nucleic Acids Res. 1995 Sep 11;23(17):3554-62. doi: 10.1093/nar/23.17.3554.
6
Effects of choice of DNA sequence model structure on gene identification accuracy.DNA序列模型结构的选择对基因识别准确性的影响。
Bioinformatics. 2004 May 1;20(7):993-1005. doi: 10.1093/bioinformatics/bth028. Epub 2004 Jan 29.
7
Gene recognition in cyanobacterium genomic sequence data using the hidden Markov model.利用隐马尔可夫模型在蓝藻基因组序列数据中进行基因识别。
Proc Int Conf Intell Syst Mol Biol. 1996;4:252-60.
8
The regional rule for bacterial base composition.细菌碱基组成的区域规则。
Trends Genet. 2005 Aug;21(8):440-3. doi: 10.1016/j.tig.2005.06.002.
9
Systematic identification of stem-loop containing sequence families in bacterial genomes.细菌基因组中含茎环序列家族的系统鉴定。
BMC Genomics. 2008 Jan 17;9:20. doi: 10.1186/1471-2164-9-20.
10
[Gene identification in prokaryotic genomes using hidden Markov model].[使用隐马尔可夫模型进行原核生物基因组中的基因识别]
Tanpakushitsu Kakusan Koso. 1997 Dec;42(17 Suppl):2993-3000.

引用本文的文献

1
MBBC: an efficient approach for metagenomic binning based on clustering.MBBC:一种基于聚类的宏基因组分箱高效方法。
BMC Bioinformatics. 2015 Feb 5;16:36. doi: 10.1186/s12859-015-0473-8.
2
DNA-energetics-based analyses suggest additional genes in prokaryotes.基于 DNA 能量的分析表明原核生物中有其他基因。
J Biosci. 2012 Jul;37(3):433-44. doi: 10.1007/s12038-012-9221-7.
3
Classifying coding DNA with nucleotide statistics.利用核苷酸统计对编码DNA进行分类。
Bioinform Biol Insights. 2009 Oct 28;3:141-54. doi: 10.4137/bbi.s3030.
4
MetaGeneAnnotator: detecting species-specific patterns of ribosomal binding site for precise gene prediction in anonymous prokaryotic and phage genomes.MetaGeneAnnotator:检测核糖体结合位点的物种特异性模式,以在未知原核生物和噬菌体基因组中进行精确的基因预测。
DNA Res. 2008 Dec;15(6):387-96. doi: 10.1093/dnares/dsn027. Epub 2008 Oct 21.
5
The genome of Borrelia recurrentis, the agent of deadly louse-borne relapsing fever, is a degraded subset of tick-borne Borrelia duttonii.致死性虱传回归热病原体——回归热疏螺旋体的基因组,是蜱传达顿疏螺旋体基因组的一个退化子集。
PLoS Genet. 2008 Sep 12;4(9):e1000185. doi: 10.1371/journal.pgen.1000185.
6
Gene prediction in novel fungal genomes using an ab initio algorithm with unsupervised training.使用具有无监督训练的从头算算法在新型真菌基因组中进行基因预测。
Genome Res. 2008 Dec;18(12):1979-90. doi: 10.1101/gr.081612.108. Epub 2008 Aug 29.
7
Prokaryotic gene finding based on physicochemical characteristics of codons calculated from molecular dynamics simulations.基于分子动力学模拟计算出的密码子理化特性进行原核生物基因发现。
Biophys J. 2008 Jun;94(11):4173-83. doi: 10.1529/biophysj.107.116392. Epub 2008 Mar 7.
8
Genome analysis of Minibacterium massiliensis highlights the convergent evolution of water-living bacteria.马赛微小杆菌的基因组分析突出了水生细菌的趋同进化。
PLoS Genet. 2007 Aug;3(8):e138. doi: 10.1371/journal.pgen.0030138. Epub 2007 Jul 5.
9
Restauro-G: a rapid genome re-annotation system for comparative genomics.Restauro-G:一种用于比较基因组学的快速基因组重新注释系统。
Genomics Proteomics Bioinformatics. 2007 Feb;5(1):53-8. doi: 10.1016/S1672-0229(07)60014-X.
10
Reductive genome evolution from the mother of Rickettsia.立克次氏体之母的还原性基因组进化。
PLoS Genet. 2007 Jan 19;3(1):e14. doi: 10.1371/journal.pgen.0030014.

本文引用的文献

1
Statistical analysis of GeneMark performance by cross-validation.通过交叉验证对GeneMark性能进行统计分析。
Comput Chem. 1996 Mar;20(1):123-33. doi: 10.1016/s0097-8485(96)80014-3.
2
Detection of eukaryotic promoters using Markov transition matrices.使用马尔可夫转移矩阵检测真核生物启动子。
Comput Chem. 1997;21(4):223-7. doi: 10.1016/s0097-8485(96)00040-x.
3
Microbial gene identification using interpolated Markov models.使用插值马尔可夫模型进行微生物基因识别。
Nucleic Acids Res. 1998 Jan 15;26(2):544-8. doi: 10.1093/nar/26.2.544.
4
The difficulty of identifying genes in anonymous vertebrate sequences.在无名脊椎动物序列中识别基因的困难。
Comput Chem. 1997;21(4):203-14. doi: 10.1016/s0097-8485(96)00039-3.
5
Genomic sequence of a Lyme disease spirochaete, Borrelia burgdorferi.莱姆病螺旋体——伯氏疏螺旋体的基因组序列。
Nature. 1997 Dec 11;390(6660):580-6. doi: 10.1038/37551.
6
GenBank.基因银行
Nucleic Acids Res. 1998 Jan 1;26(1):1-7. doi: 10.1093/nar/26.1.1.
7
The complete genome sequence of the hyperthermophilic, sulphate-reducing archaeon Archaeoglobus fulgidus.嗜热硫酸盐还原古菌富氏古球菌的全基因组序列。
Nature. 1997 Nov 27;390(6658):364-70. doi: 10.1038/37052.
8
The complete genome sequence of the gram-positive bacterium Bacillus subtilis.革兰氏阳性细菌枯草芽孢杆菌的全基因组序列。
Nature. 1997 Nov 20;390(6657):249-56. doi: 10.1038/36786.
9
A genomic perspective on protein families.蛋白质家族的基因组视角。
Science. 1997 Oct 24;278(5338):631-7. doi: 10.1126/science.278.5338.631.
10
Complete genome sequence of Methanobacterium thermoautotrophicum deltaH: functional analysis and comparative genomics.嗜热自养甲烷杆菌δH的全基因组序列:功能分析与比较基因组学
J Bacteriol. 1997 Nov;179(22):7135-55. doi: 10.1128/jb.179.22.7135-7155.1997.

微生物基因组中蛋白质编码区域的自我识别。

Self-identification of protein-coding regions in microbial genomes.

作者信息

Audic S, Claverie J M

机构信息

Structural and Genetic Information Laboratory, Centre National de la Recherche Scientifique-EP.91, 31 rue Joseph Aiguier, Marseille F-13402, France.

出版信息

Proc Natl Acad Sci U S A. 1998 Aug 18;95(17):10026-31. doi: 10.1073/pnas.95.17.10026.

DOI:10.1073/pnas.95.17.10026
PMID:9707594
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC21455/
Abstract

A new method for predicting protein-coding regions in microbial genomic DNA sequences is presented. It uses an ab initio iterative Markov modeling procedure to automatically perform the partition of genomic sequences into three subsets shown to correspond to coding, coding on the opposite strand, and noncoding segments. In contrast to current methods, such as GENEMARK [Borodovsky, M. & McIninch, J. D. (1993) Comput. Chem. 17, 123-133], no training set or prior knowledge of the statistical properties of the studied genome are required. This new method tolerates error rates of 1-2% and can process unassembled sequences. It is thus ideal for the analysis of genome survey and/or fragmented sequence data from uncharacterized microorganisms. The method was validated on 10 complete bacterial genomes (from four major phylogenetic lineages). The results show that protein-coding regions can be identified with an accuracy of up to 90% with a totally automated and objective procedure.

摘要

本文提出了一种预测微生物基因组DNA序列中蛋白质编码区的新方法。它使用从头开始的迭代马尔可夫建模程序,自动将基因组序列划分为三个子集,分别对应于编码区、反向链编码区和非编码区。与当前方法(如GENEMARK [博罗多夫斯基,M. & 麦金奇,J. D. (1993) 计算机化学17, 123 - 133])不同,该方法不需要训练集或对所研究基因组统计特性的先验知识。这种新方法能够容忍1 - 2%的错误率,并且可以处理未组装的序列。因此,它非常适合分析来自未表征微生物的基因组调查和/或片段化序列数据。该方法在10个完整的细菌基因组(来自四个主要系统发育谱系)上进行了验证。结果表明,通过完全自动化和客观的程序,可以以高达90%的准确率识别蛋白质编码区。