• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
The importance of residue-level filtering and the Top2018 best-parts dataset of high-quality protein residues.残基水平过滤的重要性和高质量蛋白质残基的 Top2018 最佳部分数据集。
Protein Sci. 2022 Jan;31(1):290-300. doi: 10.1002/pro.4239. Epub 2021 Nov 29.
2
Molprobity's ultimate rotamer-library distributions for model validation.用于模型验证的Molprobity最终旋转异构体库分布。
Proteins. 2016 Sep;84(9):1177-89. doi: 10.1002/prot.25039. Epub 2016 Jun 23.
3
Intrinsic disorder in the Protein Data Bank.蛋白质数据库中的内在无序状态。
J Biomol Struct Dyn. 2007 Feb;24(4):325-42. doi: 10.1080/07391102.2007.10507123.
4
Autofix for backward-fit sidechains: using MolProbity and real-space refinement to put misfits in their place.反向拟合侧链的自动修复:使用MolProbity和实空间精修将不匹配的部分归位。
J Struct Funct Genomics. 2009 Mar;10(1):83-93. doi: 10.1007/s10969-008-9045-8. Epub 2008 Nov 11.
5
A dataset of alternately located segments in protein crystal structures.蛋白质晶体结构中交替定位片段的数据集。
Sci Data. 2024 Jul 17;11(1):783. doi: 10.1038/s41597-024-03595-4.
6
MolProbity: More and better reference data for improved all-atom structure validation.MolProbity:用于改进全原子结构验证的更多更好的参考数据。
Protein Sci. 2018 Jan;27(1):293-315. doi: 10.1002/pro.3330. Epub 2017 Nov 27.
7
Criteria to Extract High-Quality Protein Data Bank Subsets for Structure Users.为结构用户提取高质量蛋白质数据库子集的标准。
Methods Mol Biol. 2016;1415:139-52. doi: 10.1007/978-1-4939-3572-7_7.
8
Asparagine and glutamine: using hydrogen atom contacts in the choice of side-chain amide orientation.天冬酰胺和谷氨酰胺:利用氢原子接触来选择侧链酰胺的取向。
J Mol Biol. 1999 Jan 29;285(4):1735-47. doi: 10.1006/jmbi.1998.2401.
9
Outlier Profiles of Atomic Structures Derived from X-ray Crystallography and from Cryo-Electron Microscopy.基于 X 射线晶体学和低温电子显微镜的原子结构的离群值分布。
Molecules. 2020 Mar 28;25(7):1540. doi: 10.3390/molecules25071540.
10
TESE: generating specific protein structure test set ensembles.TESE:生成特定蛋白质结构测试集合集。
Bioinformatics. 2008 Nov 15;24(22):2632-3. doi: 10.1093/bioinformatics/btn488. Epub 2008 Sep 16.

引用本文的文献

1
Cis-nonProline peptides: Genuine occurrences and their functional roles.顺式非脯氨酸肽:真实存在及其功能作用。
Protein Sci. 2025 Jun;34(6):e70157. doi: 10.1002/pro.70157.
2
PhiSiCal-Checkup: A Bayesian framework to validate amino acid conformations within experimental protein structures.PhiSiCal-Checkup:一个用于验证实验性蛋白质结构中氨基酸构象的贝叶斯框架。
Proc Natl Acad Sci U S A. 2025 Jan 7;122(1):e2416301121. doi: 10.1073/pnas.2416301121. Epub 2025 Jan 2.
3
Invariant point message passing for protein side chain packing.不变点消息传递在蛋白质侧链堆积中的应用。
Proteins. 2024 Oct;92(10):1220-1233. doi: 10.1002/prot.26705. Epub 2024 May 24.
4
Invariant point message passing for protein side chain packing.用于蛋白质侧链堆积的不变点消息传递
bioRxiv. 2023 Dec 21:2023.08.03.551328. doi: 10.1101/2023.08.03.551328.
5
ATLAS: protein flexibility description from atomistic molecular dynamics simulations.ATLAS:原子分子动力学模拟中的蛋白质柔性描述。
Nucleic Acids Res. 2024 Jan 5;52(D1):D384-D392. doi: 10.1093/nar/gkad1084.
6
Biophysical and Integrative Characterization of Protein Intrinsic Disorder as a Prime Target for Drug Discovery.蛋白质固有无序的生物物理和综合特征作为药物发现的主要靶点。
Biomolecules. 2023 Mar 14;13(3):530. doi: 10.3390/biom13030530.

本文引用的文献

1
Structure of a cereal purple acid phytase provides new insights to phytate degradation in plants.谷物紫色酸性植酸酶的结构为植物中植酸的降解提供了新的见解。
Plant Commun. 2022 Feb 19;3(2):100305. doi: 10.1016/j.xplc.2022.100305. eCollection 2022 Mar 14.
2
Improving SARS-CoV-2 structures: Peer review by early coordinate release.改进 SARS-CoV-2 结构:通过早期坐标发布进行同行评审。
Biophys J. 2021 Mar 16;120(6):1085-1096. doi: 10.1016/j.bpj.2020.12.029. Epub 2021 Jan 16.
3
A Global Ramachandran Score Identifies Protein Structures with Unlikely Stereochemistry.全球 Ramachandran 得分可识别具有不合理立体化学的蛋白质结构。
Structure. 2020 Nov 3;28(11):1249-1258.e2. doi: 10.1016/j.str.2020.08.005. Epub 2020 Aug 27.
4
Macromolecular structure determination using X-rays, neutrons and electrons: recent developments in Phenix.利用 X 射线、中子和电子进行高分子结构测定: Phenix 的最新进展。
Acta Crystallogr D Struct Biol. 2019 Oct 1;75(Pt 10):861-877. doi: 10.1107/S2059798319011471. Epub 2019 Oct 2.
5
I260Q DNA polymerase β highlights precatalytic conformational rearrangements critical for fidelity.I260Q DNA 聚合酶 β 突出了预催化构象重排对于保真度至关重要。
Nucleic Acids Res. 2018 Nov 16;46(20):10740-10756. doi: 10.1093/nar/gky825.
6
Homology-based loop modeling yields more complete crystallographic protein structures.基于同源性的环建模可产生更完整的晶体学蛋白质结构。
IUCrJ. 2018 Aug 8;5(Pt 5):585-594. doi: 10.1107/S2052252518010552. eCollection 2018 Sep 1.
7
Clustering huge protein sequence sets in linear time.线性时间内的大规模蛋白质序列集聚类。
Nat Commun. 2018 Jun 29;9(1):2542. doi: 10.1038/s41467-018-04964-5.
8
Kinetic, Thermodynamic, and Structural Analysis of Drug Resistance Mutations in Neuraminidase from the 2009 Pandemic Influenza Virus.2009 年流感大流行病毒神经氨酸酶耐药突变的动力学、热力学和结构分析。
Viruses. 2018 Jun 21;10(7):339. doi: 10.3390/v10070339.
9
MolProbity: More and better reference data for improved all-atom structure validation.MolProbity:用于改进全原子结构验证的更多更好的参考数据。
Protein Sci. 2018 Jan;27(1):293-315. doi: 10.1002/pro.3330. Epub 2017 Nov 27.
10
Use of Graph Database for the Integration of Heterogeneous Biological Data.使用图形数据库整合异构生物数据。
Genomics Inform. 2017 Mar;15(1):19-27. doi: 10.5808/GI.2017.15.1.19. Epub 2017 Mar 29.

残基水平过滤的重要性和高质量蛋白质残基的 Top2018 最佳部分数据集。

The importance of residue-level filtering and the Top2018 best-parts dataset of high-quality protein residues.

机构信息

Department of Biochemistry, Duke University, Durham, North Carolina, USA.

出版信息

Protein Sci. 2022 Jan;31(1):290-300. doi: 10.1002/pro.4239. Epub 2021 Nov 29.

DOI:10.1002/pro.4239
PMID:34779043
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8740842/
Abstract

We have curated a high-quality, "best-parts" reference dataset of about 3 million protein residues in about 15,000 PDB-format coordinate files, each containing only residues with good electron density support for a physically acceptable model conformation. The resulting prefiltered data typically contain the entire core of each chain, in quite long continuous fragments. Each reference file is a single protein chain, and the total set of files were selected for low redundancy, high resolution, good MolProbity score, and other chain-level criteria. Then each residue was critically tested for adequate local map quality to firmly support its conformation, which must also be free of serious clashes or covalent-geometry outliers. The resulting Top2018 prefiltered datasets have been released on the Zenodo online web service and are freely available for all uses under a Creative Commons license. Currently, one dataset is residue filtered on main chain plus Cβ atoms, and a second dataset is full-residue filtered; each is available at four different sequence-identity levels. Here, we illustrate both statistics and examples that show the beneficial consequences of residue-level filtering. That process is necessary because even the best of structures contain a few highly disordered local regions with poor density and low-confidence conformations that should not be included in reference data. Therefore, the open distribution of these very large, prefiltered reference datasets constitutes a notable advance for structural bioinformatics and the fields that depend upon it.

摘要

我们精心策划了一个高质量的、包含约 15000 个 PDB 格式坐标文件的“最佳部分”参考数据集,其中包含约 300 万个蛋白质残基,每个文件仅包含具有良好电子密度支持的物理可接受模型构象的残基。由此产生的预过滤数据通常包含每个链的整个核心,并且是相当长的连续片段。每个参考文件都是单个蛋白质链,所选文件集的特征为低冗余、高分辨率、良好的 MolProbity 评分以及其他链级标准。然后,每个残基都经过严格测试,以确保其局部图谱质量足以坚定地支持其构象,而且构象中不得存在严重冲突或共价几何异常。经过筛选的 Top2018 预过滤数据集已在 Zenodo 在线网络服务上发布,并可根据知识共享许可协议免费用于所有用途。目前,有一个数据集是基于主链和 Cβ 原子进行残基过滤的,另一个数据集是全残基过滤的;每个数据集都有四个不同的序列同一性水平。在这里,我们展示了统计数据和示例,说明了残基过滤的有益结果。该过程是必要的,因为即使是最好的结构也包含一些具有较差密度和低置信度构象的高度无序局部区域,这些区域不应包含在参考数据中。因此,这些非常大的、预过滤的参考数据集的公开分发是结构生物信息学及其依赖领域的重要进展。