• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

pydca v1.0:用于 RNA 和蛋白质序列直接耦联分析的综合软件。

pydca v1.0: a comprehensive software for direct coupling analysis of RNA and protein sequences.

机构信息

Steinbuch Centre for Computing, Eggenstein-Leopoldshafen 76344.

Department of Physics, Karlsruhe Institute of Technology, Eggenstein-Leopoldshafen 76344.

出版信息

Bioinformatics. 2020 Apr 1;36(7):2264-2265. doi: 10.1093/bioinformatics/btz892.

DOI:10.1093/bioinformatics/btz892
PMID:31778142
Abstract

MOTIVATION

The ongoing advances in sequencing technologies have provided a massive increase in the availability of sequence data. This made it possible to study the patterns of correlated substitution between residues in families of homologous proteins or RNAs and to retrieve structural and stability information. Direct coupling analysis (DCA) infers coevolutionary couplings between pairs of residues indicating their spatial proximity, making such information a valuable input for subsequent structure prediction.

RESULTS

Here, we present pydca, a standalone Python-based software package for the DCA of protein- and RNA-homologous families. It is based on two popular inverse statistical approaches, namely, the mean-field and the pseudo-likelihood maximization and is equipped with a series of functionalities that range from multiple sequence alignment trimming to contact map visualization. Thanks to its efficient implementation, features and user-friendly command line interface, pydca is a modular and easy-to-use tool that can be used by researchers with a wide range of backgrounds.

AVAILABILITY AND IMPLEMENTATION

pydca can be obtained from https://github.com/KIT-MBS/pydca or from the Python Package Index under the MIT License.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

测序技术的不断进步提供了大量可用的序列数据。这使得研究同源蛋白或 RNA 家族中残基之间相关替换的模式以及检索结构和稳定性信息成为可能。直接耦合分析(DCA)推断出残基对之间的共进化耦合,表明它们的空间接近性,从而使这些信息成为后续结构预测的有价值输入。

结果

在这里,我们提出了 pydca,这是一个基于 Python 的独立软件包,用于 DCA 的蛋白质和 RNA 同源家族。它基于两种流行的逆统计方法,即平均场和伪似然最大化,并配备了一系列功能,从多重序列比对修剪到接触图可视化。由于其高效的实现、功能和用户友好的命令行界面,pydca 是一个模块化的、易于使用的工具,可以供具有广泛背景的研究人员使用。

可用性和实现

pydca 可从 https://github.com/KIT-MBS/pydca 或 Python 包索引获得,许可证为 MIT 许可证。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
pydca v1.0: a comprehensive software for direct coupling analysis of RNA and protein sequences.pydca v1.0:用于 RNA 和蛋白质序列直接耦联分析的综合软件。
Bioinformatics. 2020 Apr 1;36(7):2264-2265. doi: 10.1093/bioinformatics/btz892.
2
pycofitness-Evaluating the fitness landscape of RNA and protein sequences.pycofitness—评估 RNA 和蛋白质序列的适应性景观。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae074.
3
The EVcouplings Python framework for coevolutionary sequence analysis.EVcouplings Python 框架用于共进化序列分析。
Bioinformatics. 2019 May 1;35(9):1582-1584. doi: 10.1093/bioinformatics/bty862.
4
PyFeat: a Python-based effective feature generation tool for DNA, RNA and protein sequences.PyFeat:一个基于 Python 的用于 DNA、RNA 和蛋白质序列的有效特征生成工具。
Bioinformatics. 2019 Oct 1;35(19):3831-3833. doi: 10.1093/bioinformatics/btz165.
5
RocaSec: a standalone GUI-based package for robust co-evolutionary analysis of proteins.RocaSec:一个独立的基于图形用户界面的软件包,用于进行蛋白质的稳健共进化分析。
Bioinformatics. 2020 Apr 1;36(7):2262-2263. doi: 10.1093/bioinformatics/btz890.
6
PconsC4: fast, accurate and hassle-free contact predictions.PconsC4:快速、准确、无麻烦的接触预测。
Bioinformatics. 2019 Aug 1;35(15):2677-2679. doi: 10.1093/bioinformatics/bty1036.
7
diSTruct v1.0: generating biomolecular structures from distance constraints.diSTruct v1.0:从距离约束中生成生物分子结构。
Bioinformatics. 2019 Dec 15;35(24):5337-5338. doi: 10.1093/bioinformatics/btz578.
8
BioStructMap: a Python tool for integration of protein structure and sequence-based features.BioStructMap:一个用于整合蛋白质结构和基于序列特征的 Python 工具。
Bioinformatics. 2018 Nov 15;34(22):3942-3944. doi: 10.1093/bioinformatics/bty474.
9
Sequence database versioning for command line and Galaxy bioinformatics servers.用于命令行和Galaxy生物信息学服务器的序列数据库版本控制。
Bioinformatics. 2016 Apr 15;32(8):1275-7. doi: 10.1093/bioinformatics/btv724. Epub 2015 Dec 12.
10
ConDo: protein domain boundary prediction using coevolutionary information.ConDo:利用共进化信息进行蛋白质结构域边界预测。
Bioinformatics. 2019 Jul 15;35(14):2411-2417. doi: 10.1093/bioinformatics/bty973.

引用本文的文献

1
NucleoSeeker-precision filtering of RNA databases to curate high-quality datasets.NucleoSeeker对RNA数据库进行精确筛选以整理高质量数据集。
NAR Genom Bioinform. 2025 Mar 18;7(1):lqaf021. doi: 10.1093/nargab/lqaf021. eCollection 2025 Mar.
2
RNA-Puzzles Round V: blind predictions of 23 RNA structures.RNA谜题第五轮:对23种RNA结构的盲测预测
Nat Methods. 2025 Feb;22(2):399-411. doi: 10.1038/s41592-024-02543-9. Epub 2024 Dec 2.
3
GPS-pPLM: A Language Model for Prediction of Prokaryotic Phosphorylation Sites.GPS-pPLM:一种用于预测原核磷酸化位点的语言模型。
Cells. 2024 Nov 8;13(22):1854. doi: 10.3390/cells13221854.
4
FiTMuSiC: leveraging structural and (co)evolutionary data for protein fitness prediction.FiTMuSiC:利用结构和(共)进化数据进行蛋白质适合度预测。
Hum Genomics. 2024 Apr 16;18(1):36. doi: 10.1186/s40246-024-00605-9.
5
pycofitness-Evaluating the fitness landscape of RNA and protein sequences.pycofitness—评估 RNA 和蛋白质序列的适应性景观。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae074.
6
Evolutionary selection of proteins with two folds.具有两种折叠结构的蛋白质的进化选择。
Nat Commun. 2023 Sep 6;14(1):5478. doi: 10.1038/s41467-023-41237-2.
7
Altering Specificity and Autoactivity of Plant Immune Receptors Sr33 and Sr50 Via a Rational Engineering Approach.通过合理的工程方法改变植物免疫受体 Sr33 和 Sr50 的特异性和自身活性。
Mol Plant Microbe Interact. 2023 Jul;36(7):434-446. doi: 10.1094/MPMI-07-22-0154-R. Epub 2023 Aug 14.
8
Evolutionary selection of proteins with two folds.具有两种折叠形式的蛋白质的进化选择。
bioRxiv. 2023 Jan 20:2023.01.18.524637. doi: 10.1101/2023.01.18.524637.
9
Predicting RNA distance-based contact maps by integrated deep learning on physics-inferred secondary structure and evolutionary-derived mutational coupling.基于物理推断的二级结构和进化衍生突变耦合的集成深度学习预测 RNA 距离接触图谱。
Bioinformatics. 2022 Aug 10;38(16):3900-3910. doi: 10.1093/bioinformatics/btac421.
10
CoeViz 2: Protein Graphs Derived from Amino Acid Covariance.CoeViz 2:源自氨基酸协方差的蛋白质图谱。
Front Bioinform. 2021;1. doi: 10.3389/fbinf.2021.653681. Epub 2021 Jun 24.