• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种符合 FAIR 原则的分子模拟轨迹管理解决方案。

A FAIR-Compliant Management Solution for Molecular Simulation Trajectories.

作者信息

Vitalis Andreas, Winkler Steffen, Zhang Yang, Widmer Julian, Caflisch Amedeo

机构信息

Department of Biochemistry, University of Zurich, Winterthurerstr. 190, 8057 Zurich, Switzerland.

出版信息

J Chem Inf Model. 2025 Mar 10;65(5):2443-2455. doi: 10.1021/acs.jcim.4c01301. Epub 2025 Feb 20.

DOI:10.1021/acs.jcim.4c01301
PMID:39977657
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11898051/
Abstract

Simulation studies of molecules primarily produce data that represent the configuration of the system as a function of the progress variable, usually time. Because of the high-dimensional nature of these data, which grow very quickly, compromises are often necessary and achieved by storing only a subset of the system's components, for example, stripping solvent, and by restricting the time resolution to a scale significantly coarser than the basic time step of the simulation. The resultant trajectories thus describe the essentially stochastic evolution of the molecules of interest. Maintaining their interpretability through metadata is of interest not only because they can aid researchers interested in specific systems but also for reproducibility studies and model refinement. Here, we introduce a standard for the storage of data created by molecular simulations that improves compliance with the FAIR (Findable, Accessible, Interoperable, and Reusable) principles. We describe a solution conceived in PostgreSQL, along with reference implementations, that provides stringent links between metadata and raw data, which is a major weakness of the established file formats used for storing these data. A possible structure for the logic of SQL queries is included along with salient performance testing. To close, we suggest that a PostgreSQL-based storage of simulation data, in particular when coupled to a visual user interface, can improve the FAIR compliance of molecular simulation data at all levels of visibility, and a prototype solution for accomplishing this is presented.

摘要

分子模拟研究主要产生的数据表示系统构型随进程变量(通常是时间)的变化情况。由于这些数据具有高维性且增长迅速,往往需要做出妥协,通过仅存储系统组件的一个子集(例如去除溶剂)以及将时间分辨率限制在比模拟的基本时间步长粗得多的尺度上来实现。因此,所得轨迹描述了感兴趣分子的本质随机演化。通过元数据保持其可解释性不仅因为这有助于对特定系统感兴趣的研究人员,还因为可用于再现性研究和模型优化。在此,我们引入一种用于存储分子模拟产生的数据的标准,该标准提高了对FAIR(可查找、可访问、可互操作和可重用)原则的遵循程度。我们描述了一种在PostgreSQL中构思的解决方案以及参考实现,该方案在元数据和原始数据之间提供了严格的链接,而这是用于存储这些数据的现有文件格式的一个主要弱点。文中还包含SQL查询逻辑的一种可能结构以及显著的性能测试。最后,我们建议基于PostgreSQL的模拟数据存储,特别是与可视化用户界面结合时,可以在各个可见性级别上提高分子模拟数据的FAIR合规性,并展示了实现此目的的一个原型解决方案。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/00922647d25f/ci4c01301_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/70137891ad8a/ci4c01301_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/69988449209b/ci4c01301_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/1b1331feb67b/ci4c01301_0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/00922647d25f/ci4c01301_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/70137891ad8a/ci4c01301_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/69988449209b/ci4c01301_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/1b1331feb67b/ci4c01301_0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1f99/11898051/00922647d25f/ci4c01301_0004.jpg

相似文献

1
A FAIR-Compliant Management Solution for Molecular Simulation Trajectories.一种符合 FAIR 原则的分子模拟轨迹管理解决方案。
J Chem Inf Model. 2025 Mar 10;65(5):2443-2455. doi: 10.1021/acs.jcim.4c01301. Epub 2025 Feb 20.
2
A PostgreSQL Tripal solution for large-scale genotypic and phenotypic data.一个用于大规模基因型和表型数据的 PostgreSQL Tripal 解决方案。
Database (Oxford). 2021 Aug 14;2021. doi: 10.1093/database/baab051.
3
FAIR-compliant clinical, radiomics and DICOM metadata of RIDER, interobserver, Lung1 and head-Neck1 TCIA collections.符合 FAIR 原则的 RIDER、观察者间一致性、Lung1 和 head-Neck1 TCIA 数据集的临床、影像组学和 DICOM 元数据。
Med Phys. 2020 Nov;47(11):5931-5940. doi: 10.1002/mp.14322. Epub 2020 Jun 27.
4
A Data Transformation Methodology to Create Findable, Accessible, Interoperable, and Reusable Health Data: Software Design, Development, and Evaluation Study.一种创建可发现、可访问、可互操作和可重用健康数据的数据转换方法:软件设计、开发和评估研究。
J Med Internet Res. 2023 Mar 8;25:e42822. doi: 10.2196/42822.
5
Setting up an institutional OMERO environment for bioimage data: Perspectives from both facility staff and users.为生物图像数据建立机构性的OMERO环境:设施工作人员和用户的观点
J Microsc. 2025 Jan;297(1):105-119. doi: 10.1111/jmi.13360. Epub 2024 Sep 14.
6
FAIRifying Clinical Studies Metadata: A Registry for the Biomedical Research.临床研究元数据的 FAIR 化:生物医学研究的注册中心。
Stud Health Technol Inform. 2021 May 27;281:779-783. doi: 10.3233/SHTI210281.
7
A proposed FAIR approach for disseminating geospatial information system maps.一种用于传播地理空间信息系统地图的 FAIR 方法建议。
Sci Data. 2023 Jun 16;10(1):389. doi: 10.1038/s41597-023-02281-1.
8
Enabling FAIR data in Earth and environmental science with community-centric (meta)data reporting formats.通过以社区为中心的(元)数据报告格式实现地球与环境科学领域的 FAIR 数据。
Sci Data. 2022 Nov 14;9(1):700. doi: 10.1038/s41597-022-01606-w.
9
FAIR compliant database development for human microbiome data samples.符合 FAIR 原则的人类微生物组数据样本数据库开发。
Front Cell Infect Microbiol. 2024 May 7;14:1384809. doi: 10.3389/fcimb.2024.1384809. eCollection 2024.
10
Building a global genomics observatory: Using GEOME (the Genomic Observatories Metadatabase) to expedite and improve deposition and retrieval of genetic data and metadata for biodiversity research.建立一个全球基因组观测站:利用 GEOME(基因组观测站元数据库)加快和改进生物多样性研究遗传数据和元数据的存储和检索。
Mol Ecol Resour. 2020 Nov;20(6):1458-1469. doi: 10.1111/1755-0998.13269. Epub 2020 Oct 27.

本文引用的文献

1
MDRepo-an open data warehouse for community-contributed molecular dynamics simulations of proteins.MDRepo——一个用于社区贡献的蛋白质分子动力学模拟的开放数据仓库。
Nucleic Acids Res. 2025 Jan 6;53(D1):D477-D486. doi: 10.1093/nar/gkae1109.
2
MDverse, shedding light on the dark matter of molecular dynamics simulations.MDverse,揭示分子动力学模拟的暗物质。
Elife. 2024 Aug 30;12:RP90061. doi: 10.7554/eLife.90061.
3
MD-DATA: the legacy of the ABC Consortium.MD数据:ABC联盟的遗产。
Biophys Rev. 2024 May 7;16(3):269-271. doi: 10.1007/s12551-024-01197-3. eCollection 2024 Jun.
4
MISATO: machine learning dataset of protein-ligand complexes for structure-based drug discovery.MISATO:基于结构的药物发现的蛋白质-配体复合物的机器学习数据集。
Nat Comput Sci. 2024 May;4(5):367-378. doi: 10.1038/s43588-024-00627-2. Epub 2024 May 10.
5
Advancing Molecular Dynamics: Toward Standardization, Integration, and Data Accessibility in Structural Biology.推进分子动力学:实现结构生物学中的标准化、集成化和数据可访问性。
J Phys Chem B. 2024 Mar 14;128(10):2219-2227. doi: 10.1021/acs.jpcb.3c04823. Epub 2024 Feb 28.
6
ATLAS: protein flexibility description from atomistic molecular dynamics simulations.ATLAS:原子分子动力学模拟中的蛋白质柔性描述。
Nucleic Acids Res. 2024 Jan 5;52(D1):D384-D392. doi: 10.1093/nar/gkad1084.
7
A new paradigm for molecular dynamics databases: the COVID-19 database, the legacy of a titanic community effort.一个新的分子动力学数据库范例:COVID-19 数据库,是一个庞大社区努力的遗产。
Nucleic Acids Res. 2024 Jan 5;52(D1):D393-D403. doi: 10.1093/nar/gkad991.
8
Uncertainties in Markov State Models of Small Proteins.小蛋白的马尔可夫状态模型中的不确定性。
J Chem Theory Comput. 2023 Aug 22;19(16):5516-5524. doi: 10.1021/acs.jctc.3c00372. Epub 2023 Aug 4.
9
Guidelines for Reporting Molecular Dynamics Simulations in JCIM Publications.《JCIM出版物中分子动力学模拟报告指南》
J Chem Inf Model. 2023 Jun 12;63(11):3227-3229. doi: 10.1021/acs.jcim.3c00599. Epub 2023 May 16.
10
Selecting Features for Markov Modeling: A Case Study on HP35.选择 Markov 建模的特征:以 HP35 为例的研究。
J Chem Theory Comput. 2023 Jun 13;19(11):3391-3405. doi: 10.1021/acs.jctc.3c00240. Epub 2023 May 11.