• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在从环境中分离出的细菌群落中寻找新基因。

Finding novel genes in bacterial communities isolated from the environment.

作者信息

Krause Lutz, Diaz Naryttza N, Bartels Daniela, Edwards Robert A, Pühler Alfred, Rohwer Forest, Meyer Folker, Stoye Jens

机构信息

Bielefeld University, Center for Biotechnology (CeBiTec), D-33594 Bielefeld, Germany.

出版信息

Bioinformatics. 2006 Jul 15;22(14):e281-9. doi: 10.1093/bioinformatics/btl247.

DOI:10.1093/bioinformatics/btl247
PMID:16873483
Abstract

MOTIVATION

Novel sequencing techniques can give access to organisms that are difficult to cultivate using conventional methods. When applied to environmental samples, the data generated has some drawbacks, e.g. short length of assembled contigs, in-frame stop codons and frame shifts. Unfortunately, current gene finders cannot circumvent these difficulties. At the same time, the automated prediction of genes is a prerequisite for the increasing amount of genomic sequences to ensure progress in metagenomics.

RESULTS

We introduce a novel gene finding algorithm that incorporates features overcoming the short length of the assembled contigs from environmental data, in-frame stop codons as well as frame shifts contained in bacterial sequences. The results show that by searching for sequence similarities in an environmental sample our algorithm is capable of detecting a high fraction of its gene content, depending on the species composition and the overall size of the sample. The method is valuable for hunting novel unknown genes that may be specific for the habitat where the sample is taken. Finally, we show that our algorithm can even exploit the limited information contained in the short reads generated by 454 technology for the prediction of protein coding genes.

AVAILABILITY

The program is freely available upon request.

摘要

动机

新型测序技术能够获取那些难以用传统方法培养的生物体。当应用于环境样本时,所产生的数据存在一些缺陷,例如组装的重叠群长度较短、框内终止密码子和移码。不幸的是,当前的基因预测程序无法克服这些困难。与此同时,基因的自动预测是日益增加的基因组序列的一个先决条件,以确保宏基因组学取得进展。

结果

我们引入了一种新型基因预测算法,该算法整合了一些特征,克服了环境数据中组装重叠群长度较短、细菌序列中存在的框内终止密码子以及移码等问题。结果表明,通过在环境样本中搜索序列相似性,我们的算法能够检测出其中很大一部分基因内容,这取决于样本的物种组成和总体大小。该方法对于寻找可能特定于样本采集栖息地的新型未知基因很有价值。最后,我们表明我们的算法甚至可以利用454技术产生的短读段中包含的有限信息来预测蛋白质编码基因。

可用性

该程序可根据请求免费获取。

相似文献

1
Finding novel genes in bacterial communities isolated from the environment.在从环境中分离出的细菌群落中寻找新基因。
Bioinformatics. 2006 Jul 15;22(14):e281-9. doi: 10.1093/bioinformatics/btl247.
2
CONSORF: a consensus prediction system for prokaryotic coding sequences.CONSORF:一种用于原核生物编码序列的一致性预测系统。
Bioinformatics. 2007 Nov 15;23(22):3088-90. doi: 10.1093/bioinformatics/btm512. Epub 2007 Oct 31.
3
Identification of compositionally distinct regions in genomes using the centroid method.使用质心方法识别基因组中组成不同的区域。
Bioinformatics. 2007 Oct 15;23(20):2672-7. doi: 10.1093/bioinformatics/btm405. Epub 2007 Aug 27.
4
Divide-and-conquer approach for the exemplar breakpoint distance.用于示例断点距离的分治法
Bioinformatics. 2005 May 15;21(10):2171-6. doi: 10.1093/bioinformatics/bti327. Epub 2005 Feb 15.
5
Genetic diversity and composition of a plasmid metagenome from a wastewater treatment plant.来自污水处理厂的质粒宏基因组的遗传多样性与组成
J Biotechnol. 2008 Aug 31;136(1-2):65-76. doi: 10.1016/j.jbiotec.2008.03.017. Epub 2008 Apr 8.
6
MetaGenomeThreader: a software tool for predicting genes in DNA-sequences of metagenome projects.宏基因组序列拼接软件(MetaGenomeThreader):一种用于预测宏基因组计划DNA序列中基因的软件工具。
Methods Mol Biol. 2010;668:325-38. doi: 10.1007/978-1-60761-823-2_23.
7
CEGMA: a pipeline to accurately annotate core genes in eukaryotic genomes.CEGMA:一种用于准确注释真核生物基因组中核心基因的流程。
Bioinformatics. 2007 May 1;23(9):1061-7. doi: 10.1093/bioinformatics/btm071. Epub 2007 Mar 1.
8
Homology search for genes.基因的同源性搜索
Bioinformatics. 2007 Jul 1;23(13):i97-103. doi: 10.1093/bioinformatics/btm225.
9
Bayesian classifiers for detecting HGT using fixed and variable order markov models of genomic signatures.使用基因组特征的固定和可变阶马尔可夫模型检测水平基因转移的贝叶斯分类器。
Bioinformatics. 2006 Mar 1;22(5):517-22. doi: 10.1093/bioinformatics/btk029. Epub 2006 Jan 10.
10
Identification of coding and non-coding sequences using local Holder exponent formalism.使用局部赫尔德指数形式主义识别编码和非编码序列。
Bioinformatics. 2005 Oct 15;21(20):3818-23. doi: 10.1093/bioinformatics/bti639. Epub 2005 Aug 23.

引用本文的文献

1
geneRFinder: gene finding in distinct metagenomic data complexities.基因 RFinder:在不同元基因组数据复杂性中进行基因预测。
BMC Bioinformatics. 2021 Feb 25;22(1):87. doi: 10.1186/s12859-021-03997-w.
2
Discovering viral genomes in human metagenomic data by predicting unknown protein families.通过预测未知蛋白质家族来发现人类宏基因组数据中的病毒基因组。
Sci Rep. 2018 Jan 8;8(1):28. doi: 10.1038/s41598-017-18341-7.
3
The Hologenome Across Environments and the Implications of a Host-Associated Microbial Repertoire.跨环境的全息基因组以及宿主相关微生物组的影响
Front Microbiol. 2017 May 11;8:802. doi: 10.3389/fmicb.2017.00802. eCollection 2017.
4
Gene prediction in metagenomic fragments based on the SVM algorithm.基于 SVM 算法的宏基因组片段基因预测。
BMC Bioinformatics. 2013;14 Suppl 5(Suppl 5):S12. doi: 10.1186/1471-2105-14-S5-S12. Epub 2013 Apr 10.
5
A comprehensive benchmark study of multiple sequence alignment methods: current challenges and future perspectives.多种序列比对方法的综合基准研究:当前的挑战与未来展望。
PLoS One. 2011 Mar 31;6(3):e18093. doi: 10.1371/journal.pone.0018093.
6
FragGeneScan: predicting genes in short and error-prone reads.FragGeneScan:预测短读和易错读中的基因。
Nucleic Acids Res. 2010 Nov;38(20):e191. doi: 10.1093/nar/gkq747. Epub 2010 Aug 30.
7
Metagenomics: Facts and Artifacts, and Computational Challenges*.宏基因组学:事实与假象以及计算挑战*
J Comput Sci Technol. 2009 Jan;25(1):71-81. doi: 10.1007/s11390-010-9306-4.
8
Signal processing for metagenomics: extracting information from the soup.宏基因组学的信号处理:从汤羹中提取信息。
Curr Genomics. 2009 Nov;10(7):493-510. doi: 10.2174/138920209789208255.
9
Ab initio gene identification in metagenomic sequences.从头鉴定宏基因组序列中的基因。
Nucleic Acids Res. 2010 Jul;38(12):e132. doi: 10.1093/nar/gkq275. Epub 2010 Apr 19.
10
The effect of sequencing errors on metagenomic gene prediction.测序错误对宏基因组基因预测的影响。
BMC Genomics. 2009 Nov 12;10:520. doi: 10.1186/1471-2164-10-520.