• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

将DNA序列与蛋白质序列进行比对。

Aligning a DNA sequence with a protein sequence.

作者信息

Zhang Z, Pearson W R, Miller W

机构信息

Department of Computer Science and Engineering, The Pennsylvania State University, University Park 16802, USA.

出版信息

J Comput Biol. 1997 Fall;4(3):339-49. doi: 10.1089/cmb.1997.4.339.

DOI:10.1089/cmb.1997.4.339
PMID:9278064
Abstract

We develop several algorithms for the problem of aligning DNA sequence with a protein sequence. Our methods account for frameshift errors, but not for introns in the DNA sequence. Thus, they are particularly appropriate for comparing a cDNA sequence that suffers from sequencing errors with an amino acid sequence or a protein sequence database. We describe algorithms for computing optimal alignments for several definitions of DNA-protein alignment, verify sufficient conditions for equivalence of certain definitions, describe techniques for efficient implementation, and discuss experience with these ideas in a new release of the FASTA suite of database-searching programs.

摘要

我们针对将DNA序列与蛋白质序列进行比对的问题开发了几种算法。我们的方法考虑了移码错误,但未考虑DNA序列中的内含子。因此,它们特别适用于将存在测序错误的cDNA序列与氨基酸序列或蛋白质序列数据库进行比较。我们描述了针对几种DNA-蛋白质比对定义计算最优比对的算法,验证了某些定义等价的充分条件,描述了高效实现的技术,并在数据库搜索程序FASTA套件的新版本中讨论了这些想法的实践经验。

相似文献

1
Aligning a DNA sequence with a protein sequence.将DNA序列与蛋白质序列进行比对。
J Comput Biol. 1997 Fall;4(3):339-49. doi: 10.1089/cmb.1997.4.339.
2
Computing multiple sequence/structure alignments with the T-coffee package.使用T-coffee软件包计算多序列/结构比对
Curr Protoc Bioinformatics. 2004 Feb;Chapter 3:Unit3.8. doi: 10.1002/0471250953.bi0308s04.
3
A greedy algorithm for aligning DNA sequences.一种用于比对DNA序列的贪婪算法。
J Comput Biol. 2000 Feb-Apr;7(1-2):203-14. doi: 10.1089/10665270050081478.
4
Filtering redundancies for sequence similarity search programs.为序列相似性搜索程序过滤冗余信息。
J Biomol Struct Dyn. 2005 Feb;22(4):487-92. doi: 10.1080/07391102.2005.10507020.
5
Finding protein and nucleotide similarities with FASTA.使用FASTA查找蛋白质和核苷酸的相似性。
Curr Protoc Bioinformatics. 2004 Feb;Chapter 3:Unit3.9. doi: 10.1002/0471250953.bi0309s04.
6
A tool for analyzing and annotating genomic sequences.一种用于分析和注释基因组序列的工具。
Genomics. 1997 Nov 15;46(1):37-45. doi: 10.1006/geno.1997.4984.
7
Finding homologs to nucleic acid or protein sequences using the framesearch program.使用framesearch程序查找核酸或蛋白质序列的同源物。
Curr Protoc Bioinformatics. 2002 Aug;Chapter 3:Unit 3.2. doi: 10.1002/0471250953.bi0302s00.
8
Comparison of DNA sequences with protein sequences.DNA序列与蛋白质序列的比较。
Genomics. 1997 Nov 15;46(1):24-36. doi: 10.1006/geno.1997.4995.
9
Using the FASTA program to search protein and DNA sequence databases.使用FASTA程序搜索蛋白质和DNA序列数据库。
Methods Mol Biol. 1994;25:365-89. doi: 10.1385/0-89603-276-0:365.
10
Domain identification by clustering sequence alignments.通过聚类序列比对进行结构域鉴定。
Proc Int Conf Intell Syst Mol Biol. 1997;5:124-30.

引用本文的文献

1
Genetic Basis and Evolutionary Forces of Sexually Dimorphic Color Variation in a Toad-Headed Agamid Lizard.性二态颜色变异的遗传基础和进化动力:一种蟾头蜥科蜥蜴的研究。
Mol Biol Evol. 2024 Mar 1;41(3). doi: 10.1093/molbev/msae054.
2
Protein-to-genome alignment with miniprot.用 Miniprot 进行蛋白质到基因组的比对。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad014.
3
Lightweight Pattern Matching Method for DNA Sequencing in Internet of Medical Things.物联网中 DNA 测序的轻量级模式匹配方法。
Comput Intell Neurosci. 2022 Sep 8;2022:6980335. doi: 10.1155/2022/6980335. eCollection 2022.
4
How sequence alignment scores correspond to probability models.序列比对分数如何对应概率模型。
Bioinformatics. 2020 Jan 15;36(2):408-415. doi: 10.1093/bioinformatics/btz576.
5
Finding Protein and Nucleotide Similarities with FASTA.使用FASTA查找蛋白质和核苷酸的相似性。
Curr Protoc Bioinformatics. 2016 Mar 24;53:3.9.1-3.9.25. doi: 10.1002/0471250953.bi0309s53.
6
Frameshift alignment: statistics and post-genomic applications.移码校正:统计与后基因组学应用。
Bioinformatics. 2014 Dec 15;30(24):3575-82. doi: 10.1093/bioinformatics/btu576. Epub 2014 Aug 28.
7
Gentle masking of low-complexity sequences improves homology search.低复杂度序列的柔和屏蔽可提高同源搜索性能。
PLoS One. 2011;6(12):e28819. doi: 10.1371/journal.pone.0028819. Epub 2011 Dec 19.
8
HMM-FRAME: accurate protein domain classification for metagenomic sequences containing frameshift errors.HMM-FRAME:用于分类含有移码错误的宏基因组序列的蛋白质结构域。
BMC Bioinformatics. 2011 May 24;12:198. doi: 10.1186/1471-2105-12-198.
9
Composition-based statistics and translated nucleotide searches: improving the TBLASTN module of BLAST.基于组成的统计和翻译后的核苷酸搜索:改进BLAST的TBLASTN模块
BMC Biol. 2006 Dec 7;4:41. doi: 10.1186/1741-7007-4-41.