• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
A geometric clustering algorithm with applications to structural data.一种应用于结构数据的几何聚类算法。
J Comput Biol. 2015 May;22(5):436-50. doi: 10.1089/cmb.2014.0162. Epub 2014 Dec 17.
2
Comparing geometric and kinetic cluster algorithms for molecular simulation data.比较分子模拟数据的几何和动力簇算法。
J Chem Phys. 2010 Feb 21;132(7):074110. doi: 10.1063/1.3301140.
3
Knowledge-assisted recognition of cluster boundaries in gene expression data.基因表达数据中聚类边界的知识辅助识别。
Artif Intell Med. 2005 Sep-Oct;35(1-2):171-83. doi: 10.1016/j.artmed.2005.02.007.
4
Evaluation of clustering algorithms for protein-protein interaction networks.蛋白质-蛋白质相互作用网络聚类算法的评估
BMC Bioinformatics. 2006 Nov 6;7:488. doi: 10.1186/1471-2105-7-488.
5
The NMR solution structure of intestinal fatty acid-binding protein complexed with palmitate: application of a novel distance geometry algorithm.与棕榈酸酯复合的肠道脂肪酸结合蛋白的核磁共振溶液结构:一种新型距离几何算法的应用
J Mol Biol. 1996 Dec 6;264(3):585-602. doi: 10.1006/jmbi.1996.0663.
6
A polynomial-time algorithm for de novo protein backbone structure determination from nuclear magnetic resonance data.一种用于从核磁共振数据中从头确定蛋白质主链结构的多项式时间算法。
J Comput Biol. 2006 Sep;13(7):1267-88. doi: 10.1089/cmb.2006.13.1267.
7
Clustering algorithms for identifying core atom sets and for assessing the precision of protein structure ensembles.用于识别核心原子集和评估蛋白质结构集合精度的聚类算法。
Proteins. 2005 Jun 1;59(4):673-86. doi: 10.1002/prot.20402.
8
Efficient molecular docking of NMR structures: application to HIV-1 protease.核磁共振结构的高效分子对接:在HIV-1蛋白酶中的应用
Protein Sci. 2007 Jan;16(1):43-51. doi: 10.1110/ps.062501507. Epub 2006 Nov 22.
9
A scalable and accurate method for classifying protein-ligand binding geometries using a MapReduce approach.一种使用 MapReduce 方法对蛋白质-配体结合构象进行可扩展且准确分类的方法。
Comput Biol Med. 2012 Jul;42(7):758-71. doi: 10.1016/j.compbiomed.2012.05.001. Epub 2012 Jun 2.
10
Analysis of a Gibbs sampler method for model-based clustering of gene expression data.一种基于模型的基因表达数据聚类的吉布斯采样器方法分析。
Bioinformatics. 2008 Jan 15;24(2):176-83. doi: 10.1093/bioinformatics/btm562. Epub 2007 Nov 22.

引用本文的文献

1
Efficiency of Stratification for Ensemble Docking Using Reduced Ensembles.基于缩减集合的对接集合分层的效率。
J Chem Inf Model. 2018 Sep 24;58(9):1915-1925. doi: 10.1021/acs.jcim.8b00314. Epub 2018 Aug 29.
2
A New Secondary Structure Assignment Algorithm Using Cα Backbone Fragments.一种使用Cα主链片段的新型二级结构分配算法。
Int J Mol Sci. 2016 Mar 11;17(3):333. doi: 10.3390/ijms17030333.
3
An Algorithm for Protein Helix Assignment Using Helix Geometry.一种利用螺旋几何结构进行蛋白质螺旋分配的算法。
PLoS One. 2015 Jul 1;10(7):e0129674. doi: 10.1371/journal.pone.0129674. eCollection 2015.

本文引用的文献

1
Clustering Molecular Dynamics Trajectories: 1. Characterizing the Performance of Different Clustering Algorithms.聚类分子动力学轨迹:1. 表征不同聚类算法的性能
J Chem Theory Comput. 2007 Nov;3(6):2312-34. doi: 10.1021/ct700119m.
2
Application of conformational clustering in protein-ligand docking.
Methods Mol Biol. 2012;819:169-86. doi: 10.1007/978-1-61779-465-0_12.
3
Comparing geometric and kinetic cluster algorithms for molecular simulation data.比较分子模拟数据的几何和动力簇算法。
J Chem Phys. 2010 Feb 21;132(7):074110. doi: 10.1063/1.3301140.
4
A polynomial-time algorithm for de novo protein backbone structure determination from nuclear magnetic resonance data.一种用于从核磁共振数据中从头确定蛋白质主链结构的多项式时间算法。
J Comput Biol. 2006 Sep;13(7):1267-88. doi: 10.1089/cmb.2006.13.1267.
5
A critical assessment of docking programs and scoring functions.对接程序和评分函数的批判性评估。
J Med Chem. 2006 Oct 5;49(20):5912-31. doi: 10.1021/jm050362n.
6
Automated clustering of ensembles of alternative models in protein structure databases.蛋白质结构数据库中替代模型集合的自动聚类
Protein Eng Des Sel. 2004 Jun;17(6):537-43. doi: 10.1093/protein/gzh063. Epub 2004 Aug 19.
7
Electrostatics of nanosystems: application to microtubules and the ribosome.纳米系统的静电学:在微管和核糖体中的应用。
Proc Natl Acad Sci U S A. 2001 Aug 28;98(18):10037-41. doi: 10.1073/pnas.181342398. Epub 2001 Aug 21.
8
Toward more meaningful hierarchical classification of protein three-dimensional structures.迈向更有意义的蛋白质三维结构层次分类
Proteins. 1999 Oct 1;37(1):20-9.
9
CATH--a hierarchic classification of protein domain structures.CATH——蛋白质结构域结构的层次分类。
Structure. 1997 Aug 15;5(8):1093-108. doi: 10.1016/s0969-2126(97)00260-8.
10
Structure-function relationships of cellular retinoic acid-binding proteins. Quantitative analysis of the ligand binding properties of the wild-type proteins and site-directed mutants.细胞视黄酸结合蛋白的结构-功能关系。野生型蛋白和定点突变体配体结合特性的定量分析。
J Biol Chem. 1997 Jan 17;272(3):1541-7. doi: 10.1074/jbc.272.3.1541.

一种应用于结构数据的几何聚类算法。

A geometric clustering algorithm with applications to structural data.

作者信息

Xu Shutan, Zou Shuxue, Wang Lincong

机构信息

College of Computer Science and Technology, Jilin University , Changchun, P.R. China .

出版信息

J Comput Biol. 2015 May;22(5):436-50. doi: 10.1089/cmb.2014.0162. Epub 2014 Dec 17.

DOI:10.1089/cmb.2014.0162
PMID:25517067
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4425229/
Abstract

An important feature of structural data, especially those from structural determination and protein-ligand docking programs, is that their distribution could be mostly uniform. Traditional clustering algorithms developed specifically for nonuniformly distributed data may not be adequate for their classification. Here we present a geometric partitional algorithm that could be applied to both uniformly and nonuniformly distributed data. The algorithm is a top-down approach that recursively selects the outliers as the seeds to form new clusters until all the structures within a cluster satisfy a classification criterion. The algorithm has been evaluated on a diverse set of real structural data and six sets of test data. The results show that it is superior to the previous algorithms for the clustering of structural data and is similar to or better than them for the classification of the test data. The algorithm should be especially useful for the identification of the best but minor clusters and for speeding up an iterative process widely used in NMR structure determination.

摘要

结构数据的一个重要特征,尤其是来自结构测定和蛋白质-配体对接程序的数据,是它们的分布大多可能是均匀的。专门为非均匀分布数据开发的传统聚类算法可能不足以对其进行分类。在此,我们提出一种几何划分算法,该算法可应用于均匀分布和非均匀分布的数据。该算法是一种自上而下的方法,它递归地选择离群值作为种子来形成新的聚类,直到一个聚类中的所有结构都满足分类标准。该算法已在一组多样的真实结构数据和六组测试数据上进行了评估。结果表明,对于结构数据的聚类,它优于先前的算法,对于测试数据的分类,它与先前算法相似或更好。该算法对于识别最佳但较小的聚类以及加速核磁共振结构测定中广泛使用的迭代过程应该特别有用。