• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

FramePlus:将DNA与蛋白质序列进行比对

FramePlus: aligning DNA to protein sequences.

作者信息

Halperin E, Faigler S, Gill-More R

机构信息

Compugen Ltd., Tel Aviv, Israel.

出版信息

Bioinformatics. 1999 Nov;15(11):867-73. doi: 10.1093/bioinformatics/15.11.867.

DOI:10.1093/bioinformatics/15.11.867
PMID:10743553
Abstract

MOTIVATION

Automated annotation of Expressed Sequence Tags (ESTs) is becoming increasingly important as EST databases continue to grow rapidly. A common approach to annotation is to align the gene fragments against well-documented databases of protein sequences. The sensitivity of the alignment algorithm is key to the success of such methods.

RESULTS

This paper introduces a new algorithm, FramePlus, for DNA-protein sequence alignment. The SCOP database was used to develop a general framework for testing the sensitivity of such alignment algorithms when searching large databases. Using this framework, the performance of FramePlus was found to be somewhat better than other algorithms in the presence of moderate and high rates of frameshift errors, and comparable to Translated Search in the absence of sequencing errors.

AVAILABILITY

The source code for FramePlus and the testing datasets are freely available at ftp.compugen.co.il/pub/research.

CONTACT

raveh@compugen.co.il.

摘要

动机

随着表达序列标签(EST)数据库持续快速增长,EST的自动注释变得越来越重要。一种常见的注释方法是将基因片段与记录完备的蛋白质序列数据库进行比对。比对算法的灵敏度是此类方法成功的关键。

结果

本文介绍了一种用于DNA-蛋白质序列比对的新算法FramePlus。SCOP数据库被用于开发一个通用框架,以在搜索大型数据库时测试此类比对算法的灵敏度。使用该框架发现,在存在中度和高度移码错误率的情况下,FramePlus的性能略优于其他算法,在不存在测序错误的情况下与翻译搜索相当。

可用性

FramePlus的源代码和测试数据集可从ftp.compugen.co.il/pub/research免费获取。

联系方式

raveh@compugen.co.il

相似文献

1
FramePlus: aligning DNA to protein sequences.FramePlus:将DNA与蛋白质序列进行比对
Bioinformatics. 1999 Nov;15(11):867-73. doi: 10.1093/bioinformatics/15.11.867.
2
Gene structure prediction from consensus spliced alignment of multiple ESTs matching the same genomic locus.基于与同一基因组位点匹配的多个EST的一致性剪接比对进行基因结构预测。
Bioinformatics. 2004 May 1;20(7):1157-69. doi: 10.1093/bioinformatics/bth058. Epub 2004 Feb 5.
3
A RAPID algorithm for sequence database comparisons: application to the identification of vector contamination in the EMBL databases.一种用于序列数据库比较的快速算法:应用于识别EMBL数据库中的载体污染。
Bioinformatics. 1999 Feb;15(2):111-21. doi: 10.1093/bioinformatics/15.2.111.
4
Fast and sensitive algorithm for aligning ESTs to human genome.用于将EST序列与人类基因组进行比对的快速灵敏算法。
Proc IEEE Comput Soc Bioinform Conf. 2002;1:43-53.
5
WebTraceMiner: a web service for processing and mining EST sequence trace files.WebTraceMiner:一个用于处理和挖掘EST序列追踪文件的网络服务。
Nucleic Acids Res. 2007 Jul;35(Web Server issue):W137-42. doi: 10.1093/nar/gkm299. Epub 2007 May 8.
6
Pro-Frame: similarity-based gene recognition in eukaryotic DNA sequences with errors.Pro-Frame:具有错误的真核生物DNA序列中基于相似性的基因识别
Bioinformatics. 2001 Jan;17(1):13-5. doi: 10.1093/bioinformatics/17.1.13.
7
ESTprep: preprocessing cDNA sequence reads.ESTprep:预处理cDNA序列读数。
Bioinformatics. 2003 Jul 22;19(11):1318-24. doi: 10.1093/bioinformatics/btg159.
8
A hierarchical model for incomplete alignments in phylogenetic inference.系统发育推断中不完全比对的层次模型。
Bioinformatics. 2009 Mar 1;25(5):592-8. doi: 10.1093/bioinformatics/btp015. Epub 2009 Jan 15.
9
A knowledge-based multiple-sequence alignment algorithm.基于知识的多序列比对算法。
IEEE/ACM Trans Comput Biol Bioinform. 2013 Jul-Aug;10(4):884-96. doi: 10.1109/TCBB.2013.102.
10
Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences.Cd-hit:一个用于对大量蛋白质或核苷酸序列进行聚类和比较的快速程序。
Bioinformatics. 2006 Jul 1;22(13):1658-9. doi: 10.1093/bioinformatics/btl158. Epub 2006 May 26.

引用本文的文献

1
Functional assignment of metagenomic data: challenges and applications.宏基因组数据分析的功能分配:挑战与应用。
Brief Bioinform. 2012 Nov;13(6):711-27. doi: 10.1093/bib/bbs033. Epub 2012 Jul 6.
2
HMM-FRAME: accurate protein domain classification for metagenomic sequences containing frameshift errors.HMM-FRAME:用于分类含有移码错误的宏基因组序列的蛋白质结构域。
BMC Bioinformatics. 2011 May 24;12:198. doi: 10.1186/1471-2105-12-198.
3
Composition-based statistics and translated nucleotide searches: improving the TBLASTN module of BLAST.
基于组成的统计和翻译后的核苷酸搜索:改进BLAST的TBLASTN模块
BMC Biol. 2006 Dec 7;4:41. doi: 10.1186/1741-7007-4-41.
4
Predicting genes expressed via -1 and +1 frameshifts.预测通过 -1 和 +1 移码表达的基因。
Nucleic Acids Res. 2004 Sep 15;32(16):4884-92. doi: 10.1093/nar/gkh829. Print 2004.
5
Massive sequence comparisons as a help in annotating genomic sequences.大规模序列比较有助于注释基因组序列。
Genome Res. 2001 Jul;11(7):1296-303. doi: 10.1101/gr.gr-1776r.
6
Current awareness on comparative and functional genomics.当前对比较基因组学和功能基因组学的认识。
Yeast. 2000 Sep 30;17(3):255-62. doi: 10.1002/1097-0061(20000930)17:3<255::AID-YEA9>3.0.CO;2-7.