• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在序列比对中动态地依次使用多个参数集。

Dynamic use of multiple parameter sets in sequence alignment.

作者信息

Huang Xiaoqiu, Brutlag Douglas L

机构信息

Department of Computer Science, Iowa State University, Ames, IA 50011-1040, USA.

出版信息

Nucleic Acids Res. 2007;35(2):678-86. doi: 10.1093/nar/gkl1063. Epub 2006 Dec 19.

DOI:10.1093/nar/gkl1063
PMID:17182633
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1802605/
Abstract

The level of conservation between two homologous sequences often varies among sequence regions; functionally important domains are more conserved than the remaining regions. Thus, multiple parameter sets should be used in alignment of homologous sequences with a stringent parameter set for highly conserved regions and a moderate parameter set for weakly conserved regions. We describe an alignment algorithm to allow dynamic use of multiple parameter sets with different levels of stringency in computation of an optimal alignment of two sequences. The algorithm dynamically considers various candidate alignments, partitions each candidate alignment into sections, and determines the most appropriate set of parameter values for each section of the alignment. The algorithm and its local alignment version are implemented in a computer program named GAP4. The local alignment algorithm in GAP4, that in its predecessor GAP3, and an ordinary local alignment program SIM were evaluated on 257,716 pairs of homologous sequences from 100 protein families. On 168,475 of the 257,716 pairs (a rate of 65.4%), alignments from GAP4 were more statistically significant than alignments from GAP3 and SIM.

摘要

两个同源序列之间的保守程度在不同的序列区域往往有所不同;功能上重要的结构域比其余区域更保守。因此,在比对同源序列时应使用多套参数,对于高度保守区域采用严格的参数集,对于弱保守区域采用适中的参数集。我们描述了一种比对算法,以便在计算两个序列的最优比对时动态使用具有不同严格程度的多套参数。该算法动态考虑各种候选比对,将每个候选比对划分为多个部分,并为比对的每个部分确定最合适的参数值集。该算法及其局部比对版本在一个名为GAP4的计算机程序中实现。对GAP4中的局部比对算法、其前身GAP3中的局部比对算法以及一个普通的局部比对程序SIM,在来自100个蛋白质家族的257,716对同源序列上进行了评估。在257,716对序列中的168,475对(比例为65.4%)上,GAP4得到的比对在统计学上比GAP3和SIM得到的比对更显著。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f350/1802605/5385b902f346/gkl1063f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f350/1802605/5385b902f346/gkl1063f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f350/1802605/5385b902f346/gkl1063f1.jpg

相似文献

1
Dynamic use of multiple parameter sets in sequence alignment.在序列比对中动态地依次使用多个参数集。
Nucleic Acids Res. 2007;35(2):678-86. doi: 10.1093/nar/gkl1063. Epub 2006 Dec 19.
2
Sequence alignment with an appropriate substitution matrix.使用合适的替换矩阵进行序列比对。
J Comput Biol. 2008 Mar;15(2):129-38. doi: 10.1089/cmb.2007.0155.
3
OXBench: a benchmark for evaluation of protein multiple sequence alignment accuracy.OXBench:一种用于评估蛋白质多序列比对准确性的基准。
BMC Bioinformatics. 2003 Oct 10;4:47. doi: 10.1186/1471-2105-4-47.
4
[Increasing the accuracy of the global alignment of amino acid sequences by constructing a set of alignment candidates].[通过构建一组比对候选序列提高氨基酸序列全局比对的准确性]
Biofizika. 2010 Nov-Dec;55(6):965-75.
5
DIALIGN-T: an improved algorithm for segment-based multiple sequence alignment.DIALIGN-T:一种改进的基于片段的多序列比对算法。
BMC Bioinformatics. 2005 Mar 22;6:66. doi: 10.1186/1471-2105-6-66.
6
A Shannon entropy-based filter detects high- quality profile-profile alignments in searches for remote homologues.一种基于香农熵的过滤器在搜索远源同源物时可检测到高质量的序列轮廓比对。
Proteins. 2004 Feb 1;54(2):351-60. doi: 10.1002/prot.10564.
7
Pareto optimal pairwise sequence alignment.帕累托最优的两两序列比对。
IEEE/ACM Trans Comput Biol Bioinform. 2013 Mar-Apr;10(2):481-93. doi: 10.1109/TCBB.2013.2.
8
transAlign: using amino acids to facilitate the multiple alignment of protein-coding DNA sequences.transAlign:利用氨基酸促进蛋白质编码DNA序列的多重比对。
BMC Bioinformatics. 2005 Jun 22;6:156. doi: 10.1186/1471-2105-6-156.
9
Multiple alignment of protein sequences with repeats and rearrangements.具有重复和重排的蛋白质序列的多序列比对。
Nucleic Acids Res. 2006;34(20):5932-42. doi: 10.1093/nar/gkl511. Epub 2006 Oct 26.
10
T-Coffee: A novel method for fast and accurate multiple sequence alignment.T-Coffee:一种用于快速准确的多序列比对的新方法。
J Mol Biol. 2000 Sep 8;302(1):205-17. doi: 10.1006/jmbi.2000.4042.

引用本文的文献

1
SKEMPI 2.0: an updated benchmark of changes in protein-protein binding energy, kinetics and thermodynamics upon mutation.SKEMPI 2.0:一个更新的蛋白质-蛋白质结合能、动力学和热力学突变的基准。
Bioinformatics. 2019 Feb 1;35(3):462-469. doi: 10.1093/bioinformatics/bty635.
2
Major haplotype divergence including multiple germin-like protein genes, at the wheat Sr2 adult plant stem rust resistance locus.在小麦抗成年植株秆锈病Sr2位点上,主要单倍型差异包括多个类萌发素蛋白基因。
BMC Plant Biol. 2014 Dec 30;14:379. doi: 10.1186/s12870-014-0379-z.
3
Comparative analysis of the quality of a global algorithm and a local algorithm for alignment of two sequences.

本文引用的文献

1
Maximum-likelihood estimation of the statistical distribution of Smith-Waterman local sequence similarity scores.史密斯-沃特曼局部序列相似性得分统计分布的最大似然估计。
Bull Math Biol. 1992 Jan;54(1):59-75. doi: 10.1007/BF02458620.
2
Versatile and open software for comparing large genomes.用于比较大型基因组的通用且开放的软件。
Genome Biol. 2004;5(2):R12. doi: 10.1186/gb-2004-5-2-r12. Epub 2004 Jan 30.
3
LAGAN and Multi-LAGAN: efficient tools for large-scale multiple alignment of genomic DNA.LAGAN和多LAGAN:用于基因组DNA大规模多重比对的高效工具。
两种序列比对的全局算法和局部算法质量的比较分析。
Algorithms Mol Biol. 2011 Oct 27;6(1):25. doi: 10.1186/1748-7188-6-25.
4
Comparative genomics of the social amoebae Dictyostelium discoideum and Dictyostelium purpureum.黏菌的社会阿米巴 Dictyostelium discoideum 和 Dictyostelium purpureum 的比较基因组学。
Genome Biol. 2011;12(2):R20. doi: 10.1186/gb-2011-12-2-r20. Epub 2011 Feb 28.
5
Pairwise statistical significance of local sequence alignment using multiple parameter sets and empirical justification of parameter set change penalty.使用多个参数集进行局部序列比对的成对统计显著性以及参数集变化罚分的经验依据。
BMC Bioinformatics. 2009 Mar 19;10 Suppl 3(Suppl 3):S1. doi: 10.1186/1471-2105-10-S3-S1.
Genome Res. 2003 Apr;13(4):721-31. doi: 10.1101/gr.926603. Epub 2003 Mar 12.
4
A generalized global alignment algorithm.一种广义全局比对算法。
Bioinformatics. 2003 Jan 22;19(2):228-33. doi: 10.1093/bioinformatics/19.2.228.
5
Human-mouse alignments with BLASTZ.使用BLASTZ进行人-小鼠序列比对。
Genome Res. 2003 Jan;13(1):103-7. doi: 10.1101/gr.809403.
6
AVID: A global alignment program.AVID:一个全局比对程序。
Genome Res. 2003 Jan;13(1):97-102. doi: 10.1101/gr.789803.
7
Empirical determination of effective gap penalties for sequence comparison.序列比对中有效空位罚分的经验性确定。
Bioinformatics. 2002 Nov;18(11):1500-7. doi: 10.1093/bioinformatics/18.11.1500.
8
PatternHunter: faster and more sensitive homology search.PatternHunter:更快、更灵敏的同源性搜索。
Bioinformatics. 2002 Mar;18(3):440-5. doi: 10.1093/bioinformatics/18.3.440.
9
BLAT--the BLAST-like alignment tool.BLAT——类BLAST比对工具。
Genome Res. 2002 Apr;12(4):656-64. doi: 10.1101/gr.229202.
10
BALSA: Bayesian algorithm for local sequence alignment.BALSA:用于局部序列比对的贝叶斯算法。
Nucleic Acids Res. 2002 Mar 1;30(5):1268-77. doi: 10.1093/nar/30.5.1268.