• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

DCAlign v1.0:使用共进化模型和信息先验对齐生物序列。

DCAlign v1.0: aligning biological sequences using co-evolution models and informed priors.

机构信息

Italian Institute for Genomic Medicine, IRCCS Candiolo, I-10060 Candiolo (TO), Italy.

Politecnico di Torino, I-10129 Torino, Italy.

出版信息

Bioinformatics. 2023 Sep 2;39(9). doi: 10.1093/bioinformatics/btad537.

DOI:10.1093/bioinformatics/btad537
PMID:37647658
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10491954/
Abstract

SUMMARY

DCAlign is a new alignment method able to cope with the conservation and the co-evolution signals that characterize the columns of multiple sequence alignments of homologous sequences. However, the pre-processing steps required to align a candidate sequence are computationally demanding. We show in v1.0 how to dramatically reduce the overall computing time by including an empirical prior over an informative set of variables mirroring the presence of insertions and deletions.

AVAILABILITY AND IMPLEMENTATION

DCAlign v1.0 is implemented in Julia and it is fully available at https://github.com/infernet-h2020/DCAlign.

摘要

摘要

DCAlign 是一种新的对齐方法,能够处理同源序列多序列比对列中的保守性和共进化信号。然而,对齐候选序列所需的预处理步骤计算量很大。在 v1.0 中,我们展示了如何通过包含对一组反映插入和缺失存在的信息变量的经验先验,来显著减少总体计算时间。

可用性和实现

DCAlign v1.0 是用 Julia 实现的,可在 https://github.com/infernet-h2020/DCAlign 上获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1442/10491954/152627608d84/btad537f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1442/10491954/152627608d84/btad537f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1442/10491954/152627608d84/btad537f1.jpg

相似文献

1
DCAlign v1.0: aligning biological sequences using co-evolution models and informed priors.DCAlign v1.0:使用共进化模型和信息先验对齐生物序列。
Bioinformatics. 2023 Sep 2;39(9). doi: 10.1093/bioinformatics/btad537.
2
Aligning biological sequences by exploiting residue conservation and coevolution.利用残基保守性和共进化进行生物序列比对。
Phys Rev E. 2020 Dec;102(6-1):062409. doi: 10.1103/PhysRevE.102.062409.
3
ReformAlign: improved multiple sequence alignments using a profile-based meta-alignment approach.ReformAlign:基于轮廓的元对齐方法改进的多重序列比对。
BMC Bioinformatics. 2014 Aug 7;15(1):265. doi: 10.1186/1471-2105-15-265.
4
Recursive MAGUS: Scalable and accurate multiple sequence alignment.递归 MAGUS:可扩展且精确的多重序列比对。
PLoS Comput Biol. 2021 Oct 6;17(10):e1008950. doi: 10.1371/journal.pcbi.1008950. eCollection 2021 Oct.
5
Mind the gaps: evidence of bias in estimates of multiple sequence alignments.注意差距:多重序列比对估计中的偏差证据。
Mol Biol Evol. 2007 Nov;24(11):2433-42. doi: 10.1093/molbev/msm176. Epub 2007 Aug 20.
6
GramAlign: fast alignment driven by grammar-based phylogeny.GramAlign:基于语法系统发育的快速比对
Methods Mol Biol. 2014;1079:171-89. doi: 10.1007/978-1-62703-646-7_11.
7
transAlign: using amino acids to facilitate the multiple alignment of protein-coding DNA sequences.transAlign:利用氨基酸促进蛋白质编码DNA序列的多重比对。
BMC Bioinformatics. 2005 Jun 22;6:156. doi: 10.1186/1471-2105-6-156.
8
AlignStat: a web-tool and R package for statistical comparison of alternative multiple sequence alignments.AlignStat:一个用于对多个备选序列比对进行统计比较的网络工具和R包。
BMC Bioinformatics. 2016 Oct 26;17(1):434. doi: 10.1186/s12859-016-1300-6.
9
HMMerge: an ensemble method for multiple sequence alignment.HMMerge:一种用于多序列比对的集成方法。
Bioinform Adv. 2023 Apr 17;3(1):vbad052. doi: 10.1093/bioadv/vbad052. eCollection 2023.
10
Scaling statistical multiple sequence alignment to large datasets.将统计多序列比对扩展到大型数据集。
BMC Genomics. 2016 Nov 11;17(Suppl 10):764. doi: 10.1186/s12864-016-3101-8.

本文引用的文献

1
adabmDCA: adaptive Boltzmann machine learning for biological sequences.adabmDCA:用于生物序列的自适应玻尔兹曼机学习。
BMC Bioinformatics. 2021 Oct 29;22(1):528. doi: 10.1186/s12859-021-04441-9.
2
PPalign: optimal alignment of Potts models representing proteins with direct coupling information.PPalign:具有直接耦合信息的 Potts 模型代表蛋白质的最佳对齐。
BMC Bioinformatics. 2021 Jun 10;22(1):317. doi: 10.1186/s12859-021-04222-4.
3
Aligning biological sequences by exploiting residue conservation and coevolution.利用残基保守性和共进化进行生物序列比对。
Phys Rev E. 2020 Dec;102(6-1):062409. doi: 10.1103/PhysRevE.102.062409.
4
Remote homology search with hidden Potts models.使用隐式 Potts 模型进行远程同源搜索。
PLoS Comput Biol. 2020 Nov 30;16(11):e1008085. doi: 10.1371/journal.pcbi.1008085. eCollection 2020 Nov.
5
Rfam 14: expanded coverage of metagenomic, viral and microRNA families.Rfam 14:扩展了对宏基因组、病毒和 miRNA 家族的覆盖范围。
Nucleic Acids Res. 2021 Jan 8;49(D1):D192-D200. doi: 10.1093/nar/gkaa1047.
6
Caretta - A multiple protein structure alignment and feature extraction suite.Caretta - 一个多蛋白结构比对与特征提取套件。
Comput Struct Biotechnol J. 2020 Apr 6;18:981-992. doi: 10.1016/j.csbj.2020.03.011. eCollection 2020.
7
How Pairwise Coevolutionary Models Capture the Collective Residue Variability in Proteins?成对协同进化模型如何捕捉蛋白质中的集体残基变异性?
Mol Biol Evol. 2018 Apr 1;35(4):1018-1027. doi: 10.1093/molbev/msy007.
8
Inverse statistical physics of protein sequences: a key issues review.蛋白质序列的反统计物理学:关键问题综述。
Rep Prog Phys. 2018 Mar;81(3):032601. doi: 10.1088/1361-6633/aa9965.
9
A widespread self-cleaving ribozyme class is revealed by bioinformatics.生物信息学揭示了一类广泛存在的自我剪切核酶。
Nat Chem Biol. 2014 Jan;10(1):56-60. doi: 10.1038/nchembio.1386. Epub 2013 Nov 17.
10
Infernal 1.1: 100-fold faster RNA homology searches. Infernal 1.1:100 倍更快的 RNA 同源性搜索。
Bioinformatics. 2013 Nov 15;29(22):2933-5. doi: 10.1093/bioinformatics/btt509. Epub 2013 Sep 4.