• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

从部分示例中学习序列比对的评分方案。

Learning scoring schemes for sequence alignment from partial examples.

作者信息

Kim Eagu, Kececioglu John

机构信息

Department of Computer Science, The University of Arizona, Tucson, AZ 85721, USA.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2008 Oct-Dec;5(4):546-56. doi: 10.1109/TCBB.2008.57.

DOI:10.1109/TCBB.2008.57
PMID:18989042
Abstract

When aligning biological sequences, the choice of parameter values for the alignment scoring function is critical. Small changes in gap penalties, for example, can yield radically different alignments. A rigorous way to compute parameter values that are appropriate for aligning biological sequences is through inverse parametric sequence alignment. Given a collection of examples of biologically correct alignments, this is the problem of finding parameter values that make the scores of the example alignments close to those of optimal alignments for their sequences. We extend prior work on inverse parametric alignment to partial examples, which contain regions where the alignment is left unspecified, and to an improved formulation based on minimizing the average error between the score of an example and the score of an optimal alignment. Experiments on benchmark biological alignments show we can find parameters that generalize across protein families and that boost the accuracy of multiple sequence alignment by as much as 25 percent.

摘要

在比对生物序列时,比对评分函数参数值的选择至关重要。例如,空位罚分的微小变化可能会产生截然不同的比对结果。一种计算适用于比对生物序列的参数值的严谨方法是通过逆参数序列比对。给定一组生物学上正确的比对示例,问题在于找到能使示例比对的得分接近其序列最优比对得分的参数值。我们将先前关于逆参数比对的工作扩展到部分示例,这些示例包含比对未明确指定的区域,并扩展到基于最小化示例得分与最优比对得分之间平均误差的改进公式。在基准生物比对上的实验表明,我们能够找到适用于多个蛋白质家族的参数,并且能将多序列比对的准确率提高多达25%。

相似文献

1
Learning scoring schemes for sequence alignment from partial examples.从部分示例中学习序列比对的评分方案。
IEEE/ACM Trans Comput Biol Bioinform. 2008 Oct-Dec;5(4):546-56. doi: 10.1109/TCBB.2008.57.
2
Accuracy of structure-based sequence alignment of automatic methods.自动方法的基于结构的序列比对准确性。
BMC Bioinformatics. 2007 Sep 20;8:355. doi: 10.1186/1471-2105-8-355.
3
A word-oriented approach to alignment validation.一种面向单词的比对验证方法。
Bioinformatics. 2005 May 15;21(10):2230-9. doi: 10.1093/bioinformatics/bti335. Epub 2005 Feb 22.
4
Scoring profile-to-profile sequence alignments.对图谱与图谱之间的序列进行比对评分。
Protein Sci. 2004 Jun;13(6):1612-26. doi: 10.1110/ps.03601504.
5
HMM-ModE--improved classification using profile hidden Markov models by optimising the discrimination threshold and modifying emission probabilities with negative training sequences.HMM-ModE——通过优化判别阈值并利用负训练序列修改发射概率,使用轮廓隐马尔可夫模型改进分类。
BMC Bioinformatics. 2007 Mar 27;8:104. doi: 10.1186/1471-2105-8-104.
6
Aligning protein sequences with predicted secondary structure.将蛋白质序列与预测的二级结构进行比对。
J Comput Biol. 2010 Mar;17(3):561-80. doi: 10.1089/cmb.2009.0222.
7
Learning Parameter-Advising Sets for Multiple Sequence Alignment.学习多序列比对的参数建议集。
IEEE/ACM Trans Comput Biol Bioinform. 2017 Sep-Oct;14(5):1028-1041. doi: 10.1109/TCBB.2015.2430323.
8
A structural alignment kernel for protein structures.一种用于蛋白质结构的结构比对核。
Bioinformatics. 2007 May 1;23(9):1090-8. doi: 10.1093/bioinformatics/btl642. Epub 2007 Jan 18.
9
An iterative refinement algorithm for consistency based multiple structural alignment methods.一种基于一致性的多结构比对方法的迭代优化算法。
Bioinformatics. 2006 Sep 1;22(17):2087-93. doi: 10.1093/bioinformatics/btl351. Epub 2006 Jun 29.
10
Improved multiple sequence alignments using coupled pattern mining.使用耦合模式挖掘改进多序列比对。
IEEE/ACM Trans Comput Biol Bioinform. 2013 Sep-Oct;10(5):1098-112. doi: 10.1109/TCBB.2013.36.

引用本文的文献

1
Accuracy estimation and parameter advising for protein multiple sequence alignment.蛋白质多序列比对的准确性评估与参数建议
J Comput Biol. 2013 Apr;20(4):259-79. doi: 10.1089/cmb.2013.0007. Epub 2013 Mar 14.
2
Parameters for accurate genome alignment.基因组精确比对的参数。
BMC Bioinformatics. 2010 Feb 9;11:80. doi: 10.1186/1471-2105-11-80.
3
Optimizing substitution matrix choice and gap parameters for sequence alignment.优化序列比对的替换矩阵选择和空位参数。
BMC Bioinformatics. 2009 Dec 2;10:396. doi: 10.1186/1471-2105-10-396.