• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一个用Python实现的与SCOP和ASTRAL的高级接口。

A high level interface to SCOP and ASTRAL implemented in python.

作者信息

Casbon James A, Crooks Gavin E, Saqi Mansoor A S

机构信息

Bioinformatics, Institute of Cell and Molecular Science, School of Medicine and Dentistry, Queen Mary, University of London, London EC1 6BQ, UK.

出版信息

BMC Bioinformatics. 2006 Jan 10;7:10. doi: 10.1186/1471-2105-7-10.

DOI:10.1186/1471-2105-7-10
PMID:16403221
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1373603/
Abstract

BACKGROUND

Benchmarking algorithms in structural bioinformatics often involves the construction of datasets of proteins with given sequence and structural properties. The SCOP database is a manually curated structural classification which groups together proteins on the basis of structural similarity. The ASTRAL compendium provides non redundant subsets of SCOP domains on the basis of sequence similarity such that no two domains in a given subset share more than a defined degree of sequence similarity. Taken together these two resources provide a 'ground truth' for assessing structural bioinformatics algorithms. We present a small and easy to use API written in python to enable construction of datasets from these resources.

RESULTS

We have designed a set of python modules to provide an abstraction of the SCOP and ASTRAL databases. The modules are designed to work as part of the Biopython distribution. Python users can now manipulate and use the SCOP hierarchy from within python programs, and use ASTRAL to return sequences of domains in SCOP, as well as clustered representations of SCOP from ASTRAL.

CONCLUSION

The modules make the analysis and generation of datasets for use in structural genomics easier and more principled.

摘要

背景

结构生物信息学中的基准测试算法通常涉及构建具有给定序列和结构特性的蛋白质数据集。SCOP数据库是一个经过人工整理的结构分类,它根据结构相似性将蛋白质归为一组。ASTRAL汇编基于序列相似性提供SCOP结构域的非冗余子集,使得给定子集中的任意两个结构域的序列相似性不超过定义的程度。这两种资源共同为评估结构生物信息学算法提供了“基本事实”。我们展示了一个用Python编写的小型且易于使用的应用程序编程接口,以实现从这些资源构建数据集。

结果

我们设计了一组Python模块,以提供SCOP和ASTRAL数据库的抽象。这些模块被设计为作为Biopython发行版的一部分工作。Python用户现在可以在Python程序中操作和使用SCOP层次结构,并使用ASTRAL返回SCOP中结构域的序列,以及来自ASTRAL的SCOP聚类表示。

结论

这些模块使结构基因组学中数据集的分析和生成更加容易且更具原则性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0084/1373603/f9404eacea88/1471-2105-7-10-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0084/1373603/f9404eacea88/1471-2105-7-10-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0084/1373603/f9404eacea88/1471-2105-7-10-1.jpg

相似文献

1
A high level interface to SCOP and ASTRAL implemented in python.一个用Python实现的与SCOP和ASTRAL的高级接口。
BMC Bioinformatics. 2006 Jan 10;7:10. doi: 10.1186/1471-2105-7-10.
2
SIMAP--the similarity matrix of proteins.SIMAP——蛋白质相似性矩阵。
Bioinformatics. 2005 Sep 1;21 Suppl 2:ii42-6. doi: 10.1093/bioinformatics/bti1107.
3
ProtBuD: a database of biological unit structures of protein families and superfamilies.ProtBuD:蛋白质家族和超家族的生物单元结构数据库。
Bioinformatics. 2006 Dec 1;22(23):2876-82. doi: 10.1093/bioinformatics/btl490. Epub 2006 Oct 2.
4
PROMPT: a protein mapping and comparison tool.提示:一种蛋白质图谱绘制与比较工具。
BMC Bioinformatics. 2006 Jul 4;7:331. doi: 10.1186/1471-2105-7-331.
5
On distance and similarity in fold space.关于折叠空间中的距离和相似性。
Bioinformatics. 2008 Mar 15;24(6):872-3. doi: 10.1093/bioinformatics/btn040. Epub 2008 Jan 28.
6
Protein structural similarity search by Ramachandran codes.通过拉马钱德兰编码进行蛋白质结构相似性搜索。
BMC Bioinformatics. 2007 Aug 23;8:307. doi: 10.1186/1471-2105-8-307.
7
HotSwap for bioinformatics: a STRAP tutorial.生物信息学中的热插拔:STRAP教程
BMC Bioinformatics. 2006 Feb 9;7:64. doi: 10.1186/1471-2105-7-64.
8
AutoSCOP: automated prediction of SCOP classifications using unique pattern-class mappings.AutoSCOP:使用独特的模式-类别映射自动预测SCOP分类
Bioinformatics. 2007 May 15;23(10):1203-10. doi: 10.1093/bioinformatics/btm089. Epub 2007 Mar 22.
9
SCOWLP: a web-based database for detailed characterization and visualization of protein interfaces.SCOWLP:一个用于蛋白质界面详细表征和可视化的基于网络的数据库。
BMC Bioinformatics. 2006 Mar 2;7:104. doi: 10.1186/1471-2105-7-104.
10
DOCKGROUND resource for studying protein-protein interfaces.用于研究蛋白质-蛋白质相互作用界面的DOCKGROUND资源。
Bioinformatics. 2006 Nov 1;22(21):2612-8. doi: 10.1093/bioinformatics/btl447. Epub 2006 Aug 23.

引用本文的文献

1
Fast and accurate protein substructure searching with simulated annealing and GPUs.使用模拟退火和 GPU 进行快速准确的蛋白质亚结构搜索。
BMC Bioinformatics. 2010 Sep 3;11:446. doi: 10.1186/1471-2105-11-446.
2
Tableau-based protein substructure search using quadratic programming.基于Tableau的二次规划蛋白质亚结构搜索
BMC Bioinformatics. 2009 May 19;10:153. doi: 10.1186/1471-2105-10-153.

本文引用的文献

1
S4: structure-based sequence alignments of SCOP superfamilies.S4:SCOP超家族基于结构的序列比对。
Nucleic Acids Res. 2005 Jan 1;33(Database issue):D219-22. doi: 10.1093/nar/gki043.
2
Analysis of superfamily specific profile-profile recognition accuracy.超家族特异性profile-profile识别准确性分析。
BMC Bioinformatics. 2004 Dec 16;5:200. doi: 10.1186/1471-2105-5-200.
3
The Bio* toolkits--a brief overview.生物工具包——简要概述。
Brief Bioinform. 2002 Sep;3(3):296-302. doi: 10.1093/bib/3.3.296.
4
The ASTRAL compendium for protein structure and sequence analysis.用于蛋白质结构和序列分析的ASTRAL汇编
Nucleic Acids Res. 2000 Jan 1;28(1):254-6. doi: 10.1093/nar/28.1.254.
5
Assessing sequence comparison methods with reliable structurally identified distant evolutionary relationships.利用可靠的结构鉴定远距离进化关系评估序列比较方法。
Proc Natl Acad Sci U S A. 1998 May 26;95(11):6073-8. doi: 10.1073/pnas.95.11.6073.
6
SCOP: a structural classification of proteins database for the investigation of sequences and structures.SCOP:用于序列和结构研究的蛋白质数据库结构分类
J Mol Biol. 1995 Apr 7;247(4):536-40. doi: 10.1006/jmbi.1995.0159.