• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用遗传算法优化引导树以改进多种蛋白质三维结构比对。

Guide tree optimization with genetic algorithm to improve multiple protein 3D-structure alignment.

作者信息

Shegay Maksim V, Švedas Vytas K, Voevodin Vladimir V, Suplatov Dmitry A, Popova Nina N

机构信息

Faculty of Computational Mathematics and Cybernetics, Lomonosov Moscow State University, Vorobjev Hills, Moscow 119991, Russia.

Belozersky Institute of Physico-Chemical Biology, Lomonosov Moscow State University, Vorobjev Hills, Moscow 119991, Russia.

出版信息

Bioinformatics. 2022 Jan 27;38(4):985-989. doi: 10.1093/bioinformatics/btab798.

DOI:10.1093/bioinformatics/btab798
PMID:34849594
Abstract

MOTIVATION

With the increasing availability of 3D-data, the focus of comparative bioinformatic analysis is shifting from protein sequence alignments toward more content-rich 3D-alignments. This raises the need for new ways to improve the accuracy of 3D-superimposition.

RESULTS

We proposed guide tree optimization with genetic algorithm (GA) as a universal tool to improve the alignment quality of multiple protein 3D-structures systematically. As a proof of concept, we implemented the suggested GA-based approach in popular Matt and Caretta multiple protein 3D-structure alignment (M3DSA) algorithms, leading to a statistically significant improvement of the TM-score quality indicator by up to 220-1523% on 'SABmark Superfamilies' (in 49-77% of cases) and 'SABmark Twilight' (in 59-80% of cases) datasets. The observed improvement in collections of distant homologies highlights the potentials of GA to optimize 3D-alignments of diverse protein superfamilies as one plausible tool to study the structure-function relationship.

AVAILABILITY AND IMPLEMENTATION

The source codes of patched gaCaretta and gaMatt programs are available open-access at https://github.com/n-canter/gamaps.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

随着3D数据可用性的不断提高,比较生物信息学分析的重点正从蛋白质序列比对转向内容更丰富的3D比对。这就需要新的方法来提高3D叠加的准确性。

结果

我们提出了使用遗传算法(GA)进行引导树优化,作为一种通用工具来系统地提高多个蛋白质3D结构的比对质量。作为概念验证,我们在流行的Matt和Caretta多蛋白质3D结构比对(M3DSA)算法中实现了基于GA的建议方法,在“SABmark超家族”数据集(49 - 77%的情况)和“SABmark黄昏区”数据集(59 - 80%的情况)上,TM分数质量指标在统计上有显著提高,提高幅度高达220 - 1523%。在远缘同源物集合中观察到的改进突出了GA作为一种合理工具来优化不同蛋白质超家族的3D比对以研究结构 - 功能关系的潜力。

可用性和实现方式

打补丁的gaCaretta和gaMatt程序的源代码可在https://github.com/n-canter/gamaps上开放获取。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
Guide tree optimization with genetic algorithm to improve multiple protein 3D-structure alignment.利用遗传算法优化引导树以改进多种蛋白质三维结构比对。
Bioinformatics. 2022 Jan 27;38(4):985-989. doi: 10.1093/bioinformatics/btab798.
2
parMATT: parallel multiple alignment of protein 3D-structures with translations and twists for distributed-memory systems.parMATT:分布式内存系统中具有平移和扭转的蛋白质 3D 结构的并行多重比对。
Bioinformatics. 2019 Nov 1;35(21):4456-4458. doi: 10.1093/bioinformatics/btz224.
3
Matt: local flexibility aids protein multiple structure alignment.马特:局部灵活性有助于蛋白质多结构比对。
PLoS Comput Biol. 2008 Jan;4(1):e10. doi: 10.1371/journal.pcbi.0040010.
4
mTM-align: an algorithm for fast and accurate multiple protein structure alignment.mTM-align:一种快速准确的多蛋白质结构比对算法。
Bioinformatics. 2018 May 15;34(10):1719-1725. doi: 10.1093/bioinformatics/btx828.
5
Formatt: Correcting protein multiple structural alignments by incorporating sequence alignment.格式:通过结合序列比对来校正蛋白质多重结构比对。
BMC Bioinformatics. 2012 Oct 6;13:259. doi: 10.1186/1471-2105-13-259.
6
MAGUS: Multiple sequence Alignment using Graph clUStering.MAGUS:基于图聚类的多重序列比对。
Bioinformatics. 2021 Jul 19;37(12):1666-1672. doi: 10.1093/bioinformatics/btaa992.
7
RNA-align: quick and accurate alignment of RNA 3D structures based on size-independent TM-scoreRNA.RNA-align:基于与尺寸无关的 TM-scoreRNA 的快速准确的 RNA 3D 结构比对
Bioinformatics. 2019 Nov 1;35(21):4459-4461. doi: 10.1093/bioinformatics/btz282.
8
Sequoya: multiobjective multiple sequence alignment in Python.Sequoya:Python 中的多目标多序列比对。
Bioinformatics. 2020 Jun 1;36(12):3892-3893. doi: 10.1093/bioinformatics/btaa257.
9
M2Align: parallel multiple sequence alignment with a multi-objective metaheuristic.M2Align:一种使用多目标元启发式算法的并行多序列比对方法。
Bioinformatics. 2017 Oct 1;33(19):3011-3017. doi: 10.1093/bioinformatics/btx338.
10
Optimizing multiple sequence alignments using a genetic algorithm based on three objectives: structural information, non-gaps percentage and totally conserved columns.使用基于三个目标的遗传算法来优化多重序列比对:结构信息、非空位百分比和完全保守列。
Bioinformatics. 2013 Sep 1;29(17):2112-21. doi: 10.1093/bioinformatics/btt360. Epub 2013 Jun 21.

引用本文的文献

1
Beyond sequence: Structure-based machine learning.超越序列:基于结构的机器学习。
Comput Struct Biotechnol J. 2022 Dec 29;21:630-643. doi: 10.1016/j.csbj.2022.12.039. eCollection 2023.