• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

medna-metadata:一个用于跟踪环境 DNA 样本和元数据的开源数据管理系统。

medna-metadata: an open-source data management system for tracking environmental DNA samples and metadata.

机构信息

School of Computing and Information Science, University of Maine, Orono, ME 04469, USA.

Department of Molecular and Biomedical Sciences, University of Maine, Orono, ME 04469, USA.

出版信息

Bioinformatics. 2022 Sep 30;38(19):4589-4597. doi: 10.1093/bioinformatics/btac556.

DOI:10.1093/bioinformatics/btac556
PMID:35960154
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9524998/
Abstract

MOTIVATION

Environmental DNA (eDNA), as a rapidly expanding research field, stands to benefit from shared resources including sampling protocols, study designs, discovered sequences, and taxonomic assignments to sequences. High-quality community shareable eDNA resources rely heavily on comprehensive metadata documentation that captures the complex workflows covering field sampling, molecular biology lab work, and bioinformatic analyses. There are limited sources that provide documentation of database development on comprehensive metadata for eDNA and these workflows and no open-source software.

RESULTS

We present medna-metadata, an open-source, modular system that aligns with Findable, Accessible, Interoperable, and Reusable guiding principles that support scholarly data reuse and the database and application development of a standardized metadata collection structure that encapsulates critical aspects of field data collection, wet lab processing, and bioinformatic analysis. Medna-metadata is showcased with metabarcoding data from the Gulf of Maine (Polinski et al., 2019).

AVAILABILITY AND IMPLEMENTATION

The source code of the medna-metadata web application is hosted on GitHub (https://github.com/Maine-eDNA/medna-metadata). Medna-metadata is a docker-compose installable package. Documentation can be found at https://medna-metadata.readthedocs.io/en/latest/?badge=latest. The application is implemented in Python, PostgreSQL and PostGIS, RabbitMQ, and NGINX, with all major browsers supported. A demo can be found at https://demo.metadata.maine-edna.org/.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

环境 DNA(eDNA)作为一个快速发展的研究领域,可以从共享资源中受益,包括采样方案、研究设计、发现的序列以及序列的分类分配。高质量的社区共享 eDNA 资源严重依赖于全面的元数据文档,这些文档记录了涵盖现场采样、分子生物学实验室工作和生物信息学分析的复杂工作流程。提供有关 eDNA 数据库开发以及这些工作流程全面元数据的文档的资源有限,并且没有开源软件。

结果

我们提出了 medna-metadata,这是一个开源的、模块化的系统,符合可发现、可访问、可互操作和可重复使用的指导原则,支持学术数据重用以及数据库和应用程序开发标准化元数据收集结构,该结构封装了现场数据收集、湿实验室处理和生物信息学分析的关键方面。medna-metadata 展示了来自缅因湾的 metabarcoding 数据(Polinski 等人,2019 年)。

可用性和实现

medna-metadata 网络应用程序的源代码托管在 GitHub 上(https://github.com/Maine-eDNA/medna-metadata)。medna-metadata 是一个可通过 docker-compose 安装的软件包。文档可在 https://medna-metadata.readthedocs.io/en/latest/?badge=latest 找到。该应用程序是用 Python、PostgreSQL 和 PostGIS、RabbitMQ 和 NGINX 实现的,支持所有主流浏览器。演示可以在 https://demo.metadata.maine-edna.org/ 找到。

补充信息

补充数据可在 Bioinformatics 在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/28329a36a461/btac556f10.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/75f1040425f2/btac556f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/14d0155094c8/btac556f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/76c01f3d5657/btac556f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/7229d5438615/btac556f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/f767dc487e06/btac556f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/0bbf8d4685b9/btac556f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/0c6cd85ed55b/btac556f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/55487a7fb38d/btac556f8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/b274b07bd969/btac556f9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/28329a36a461/btac556f10.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/75f1040425f2/btac556f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/14d0155094c8/btac556f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/76c01f3d5657/btac556f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/7229d5438615/btac556f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/f767dc487e06/btac556f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/0bbf8d4685b9/btac556f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/0c6cd85ed55b/btac556f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/55487a7fb38d/btac556f8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/b274b07bd969/btac556f9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47ee/9524998/28329a36a461/btac556f10.jpg

相似文献

1
medna-metadata: an open-source data management system for tracking environmental DNA samples and metadata.medna-metadata:一个用于跟踪环境 DNA 样本和元数据的开源数据管理系统。
Bioinformatics. 2022 Sep 30;38(19):4589-4597. doi: 10.1093/bioinformatics/btac556.
2
Detecting and correcting misclassified sequences in the large-scale public databases.检测和纠正大规模公共数据库中的错误分类序列。
Bioinformatics. 2020 Sep 15;36(18):4699-4705. doi: 10.1093/bioinformatics/btaa586.
3
CONSTAX2: improved taxonomic classification of environmental DNA markers.CONSTAX2:改进环境 DNA 标记物的分类学分类。
Bioinformatics. 2021 Nov 5;37(21):3941-3943. doi: 10.1093/bioinformatics/btab347.
4
Adamant: a JSON schema-based metadata editor for research data management workflows.坚韧不拔:一个基于 JSON 模式的元数据编辑器,用于研究数据管理工作流程。
F1000Res. 2022 Apr 29;11:475. doi: 10.12688/f1000research.110875.2. eCollection 2022.
5
FAIR-compliant clinical, radiomics and DICOM metadata of RIDER, interobserver, Lung1 and head-Neck1 TCIA collections.符合 FAIR 原则的 RIDER、观察者间一致性、Lung1 和 head-Neck1 TCIA 数据集的临床、影像组学和 DICOM 元数据。
Med Phys. 2020 Nov;47(11):5931-5940. doi: 10.1002/mp.14322. Epub 2020 Jun 27.
6
Microbench: automated metadata management for systems biology benchmarking and reproducibility in Python.微基准:用于系统生物学基准测试和 Python 可重复性的自动化元数据管理。
Bioinformatics. 2022 Oct 14;38(20):4823-4825. doi: 10.1093/bioinformatics/btac580.
7
Globally Accessible Distributed Data Sharing (GADDS): a decentralized FAIR platform to facilitate data sharing in the life sciences.全球可访问分布式数据共享(GADDS):一个去中心化的 FAIR 平台,旨在促进生命科学领域的数据共享。
Bioinformatics. 2022 Aug 2;38(15):3812-3817. doi: 10.1093/bioinformatics/btac362.
8
Tyto: A Python Tool Enabling Better Annotation Practices for Synthetic Biology Data-Sharing.Tyto:一种用于合成生物学数据共享的、能实现更好注释实践的Python工具。
ACS Synth Biol. 2022 Mar 18;11(3):1373-1376. doi: 10.1021/acssynbio.1c00450. Epub 2022 Feb 28.
9
Patpat: a public proteomics dataset search framework.Patpat:一个公共蛋白质组学数据集搜索框架。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad076.
10
Systematic review of marine environmental DNA metabarcoding studies: toward best practices for data usability and accessibility.海洋环境 DNA metabarcoding 研究的系统评价:提高数据可用性和可访问性的最佳实践。
PeerJ. 2023 Mar 24;11:e14993. doi: 10.7717/peerj.14993. eCollection 2023.

引用本文的文献

1
Three steps towards comparability and standardization among molecular methods for characterizing insect communities.实现昆虫群落分子特征描述方法的可比性和标准化的三个步骤。
Philos Trans R Soc Lond B Biol Sci. 2024 Jun 24;379(1904):20230118. doi: 10.1098/rstb.2023.0118. Epub 2024 May 6.
2
Ten quick tips for avoiding pitfalls in multi-omics data integration analyses.避免组学数据整合分析陷阱的 10 个快速技巧。
PLoS Comput Biol. 2023 Jul 6;19(7):e1011224. doi: 10.1371/journal.pcbi.1011224. eCollection 2023 Jul.

本文引用的文献

1
Handling of spurious sequences affects the outcome of high-throughput 16S rRNA gene amplicon profiling.假序列的处理会影响高通量16S rRNA基因扩增子分析的结果。
ISME Commun. 2021 Jun 29;1(1):31. doi: 10.1038/s43705-021-00033-z.
2
A data management infrastructure for the integration of imaging and omics data in life sciences.生命科学中用于整合成像和组学数据的数据管理基础设施。
BMC Bioinformatics. 2022 Feb 7;23(1):61. doi: 10.1186/s12859-022-04584-3.
3
Environmental DNA metabarcoding for benthic monitoring: A review of sediment sampling and DNA extraction methods.
环境 DNA 宏条形码技术在底栖生物监测中的应用:沉积物采样和 DNA 提取方法的综述。
Sci Total Environ. 2022 Apr 20;818:151783. doi: 10.1016/j.scitotenv.2021.151783. Epub 2021 Nov 19.
4
GreeNC 2.0: a comprehensive database of plant long non-coding RNAs.GreeNC 2.0:一个植物长非编码 RNA 的综合数据库。
Nucleic Acids Res. 2022 Jan 7;50(D1):D1442-D1447. doi: 10.1093/nar/gkab1014.
5
Reproducible, scalable, and shareable analysis pipelines with bioinformatics workflow managers.使用生物信息学工作流管理器的可重复、可扩展且可共享的分析管道。
Nat Methods. 2021 Oct;18(10):1161-1168. doi: 10.1038/s41592-021-01254-9. Epub 2021 Sep 23.
6
Streamlining data-intensive biology with workflow systems.使用工作流程系统简化数据密集型生物学研究。
Gigascience. 2021 Jan 13;10(1). doi: 10.1093/gigascience/giaa140.
7
A total crapshoot? Evaluating bioinformatic decisions in animal diet metabarcoding analyses.完全是碰运气?评估动物饮食代谢条形码分析中的生物信息学决策。
Ecol Evol. 2020 Jul 23;10(18):9721-9739. doi: 10.1002/ece3.6594. eCollection 2020 Sep.
8
Predicting the fate of eDNA in the environment and implications for studying biodiversity.预测环境中 eDNA 的命运及其对生物多样性研究的影响。
Proc Biol Sci. 2019 Nov 20;286(1915):20191409. doi: 10.1098/rspb.2019.1409.
9
A practical guide to sample preservation and pre-PCR processing of aquatic environmental DNA.水生环境 DNA 的样本保存和 PCR 前处理实用指南。
Mol Ecol Resour. 2020 Jan;20(1):29-39. doi: 10.1111/1755-0998.13107. Epub 2019 Nov 12.
10
Metabarcoding assessment of prokaryotic and eukaryotic taxa in sediments from Stellwagen Bank National Marine Sanctuary.对史格湾国家海洋保护区沉积物中细菌和真核生物分类群的宏条形码评估。
Sci Rep. 2019 Oct 15;9(1):14820. doi: 10.1038/s41598-019-51341-3.