• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

pyProCT:用于结构生物信息学的自动聚类分析

pyProCT: Automated Cluster Analysis for Structural Bioinformatics.

作者信息

Gil Víctor A, Guallar Víctor

机构信息

Joint BSC-CRG-IRB Research Program in Computational Biology, Barcelona Supercomputing Center, Jordi Girona 29, 08034 Barcelona, Spain.

Institució Catalana de Recerca i Estudis Avançats (ICREA), Passeig Lluís Companys 23, E-08010 Barcelona, Spain.

出版信息

J Chem Theory Comput. 2014 Aug 12;10(8):3236-43. doi: 10.1021/ct500306s. Epub 2014 Jul 28.

DOI:10.1021/ct500306s
PMID:26588293
Abstract

Cluster analysis is becoming a relevant tool in structural bioinformatics. It allows analyzing large conformational ensembles in order to extract features or diminish redundancy, or just as a first step for other methods. Unfortunately, the successfulness of this analysis strongly depends on the data set traits, the chosen algorithm, and its parameters, which can lead to poor or even erroneous results not easily detected. In order to overcome this problem, we have developed pyProCT, a Python open source cluster analysis toolkit specially designed to be used with ensembles of biomolecule conformations. pyProCT implements an automated protocol to choose the clustering algorithm and parameters that produce the best results for a particular data set. It offers different levels of customization according to users' expertise. Moreover, pyProCT has been designed as a collection of interchangeable libraries, making it easier to reuse it as part of other programs.

摘要

聚类分析正成为结构生物信息学中的一种重要工具。它允许分析大型构象集合,以提取特征或减少冗余,或者仅仅作为其他方法的第一步。不幸的是,这种分析的成功很大程度上取决于数据集特征、所选算法及其参数,这可能导致不易检测到的不良甚至错误结果。为了克服这个问题,我们开发了pyProCT,这是一个专门设计用于生物分子构象集合的Python开源聚类分析工具包。pyProCT实现了一个自动协议,用于选择能为特定数据集产生最佳结果的聚类算法和参数。它根据用户的专业知识提供不同程度的定制。此外,pyProCT被设计为一个可互换库的集合,使其更易于作为其他程序的一部分进行重用。

相似文献

1
pyProCT: Automated Cluster Analysis for Structural Bioinformatics.pyProCT:用于结构生物信息学的自动聚类分析
J Chem Theory Comput. 2014 Aug 12;10(8):3236-43. doi: 10.1021/ct500306s. Epub 2014 Jul 28.
2
Clustering of gene expression data: performance and similarity analysis.基因表达数据的聚类:性能与相似性分析
BMC Bioinformatics. 2006 Dec 12;7 Suppl 4(Suppl 4):S19. doi: 10.1186/1471-2105-7-S4-S19.
3
Visual MRI: merging information visualization and non-parametric clustering techniques for MRI dataset analysis.可视化磁共振成像:融合信息可视化与非参数聚类技术用于磁共振成像数据集分析。
Artif Intell Med. 2008 Nov;44(3):183-99. doi: 10.1016/j.artmed.2008.06.006. Epub 2008 Sep 4.
4
Evaluation of stability of k-means cluster ensembles with respect to random initialization.关于随机初始化的k均值聚类集成稳定性评估。
IEEE Trans Pattern Anal Mach Intell. 2006 Nov;28(11):1798-808. doi: 10.1109/TPAMI.2006.226.
5
Automated clustering of ensembles of alternative models in protein structure databases.蛋白质结构数据库中替代模型集合的自动聚类
Protein Eng Des Sel. 2004 Jun;17(6):537-43. doi: 10.1093/protein/gzh063. Epub 2004 Aug 19.
6
RNACluster: An integrated tool for RNA secondary structure comparison and clustering.RNA聚类:一种用于RNA二级结构比较和聚类的集成工具。
J Comput Chem. 2008 Jul 15;29(9):1517-26. doi: 10.1002/jcc.20911.
7
Coordination of cluster ensembles via exact methods.通过精确方法协调聚类集成。
IEEE Trans Pattern Anal Mach Intell. 2011 Feb;33(2):279-93. doi: 10.1109/TPAMI.2010.85.
8
FreeSASA: An open source C library for solvent accessible surface area calculations.FreeSASA:一个用于计算溶剂可及表面积的开源C语言库。
F1000Res. 2016 Feb 18;5:189. doi: 10.12688/f1000research.7931.1. eCollection 2016.
9
LCE: a link-based cluster ensemble method for improved gene expression data analysis.LCE:一种基于链接的聚类集成方法,用于改进基因表达数据分析。
Bioinformatics. 2010 Jun 15;26(12):1513-9. doi: 10.1093/bioinformatics/btq226. Epub 2010 May 5.
10
Analysis of a Gibbs sampler method for model-based clustering of gene expression data.一种基于模型的基因表达数据聚类的吉布斯采样器方法分析。
Bioinformatics. 2008 Jan 15;24(2):176-83. doi: 10.1093/bioinformatics/btm562. Epub 2007 Nov 22.

引用本文的文献

1
pyDockDNA: A new web server for energy-based protein-DNA docking and scoring.pyDockDNA:一个用于基于能量的蛋白质-DNA对接和评分的新网络服务器。
Front Mol Biosci. 2022 Oct 6;9:988996. doi: 10.3389/fmolb.2022.988996. eCollection 2022.
2
Adaptive simulations, towards interactive protein-ligand modeling.自适应模拟,迈向交互式蛋白质-配体建模。
Sci Rep. 2017 Aug 16;7(1):8466. doi: 10.1038/s41598-017-08445-5.
3
Nucleoside inhibitors of tick-borne encephalitis virus.蜱传脑炎病毒的核苷抑制剂
Antimicrob Agents Chemother. 2015 Sep;59(9):5483-93. doi: 10.1128/AAC.00807-15. Epub 2015 Jun 29.