• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

iRODS 元数据管理在癌症基因组分析工作流中的应用。

iRODS metadata management for a cancer genome analysis workflow.

机构信息

Regional Computing Center (RRZK), University of Cologne, Cologne, 50931, Germany.

Department of Translational Genomics, Center of Integrated Oncology Cologne-Bonn, Medical Faculty, University of Cologne, Cologne, 50931, Germany.

出版信息

BMC Bioinformatics. 2019 Jan 15;20(1):29. doi: 10.1186/s12859-018-2576-5.

DOI:10.1186/s12859-018-2576-5
PMID:30646845
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6334444/
Abstract

BACKGROUND

The massive amounts of data from next generation sequencing (NGS) methods pose various challenges with respect to data security, storage and metadata management. While there is a broad range of data analysis pipelines, these challenges remain largely unaddressed to date.

RESULTS

We describe the integration of the open-source metadata management system iRODS (Integrated Rule-Oriented Data System) with a cancer genome analysis pipeline in a high performance computing environment. The system allows for customized metadata attributes as well as fine-grained protection rules and is augmented by a user-friendly front-end for metadata input. This results in a robust, efficient end-to-end workflow under consideration of data security, central storage and unified metadata information.

CONCLUSIONS

Integrating iRODS with an NGS data analysis pipeline is a suitable method for addressing the challenges of data security, storage and metadata management in NGS environments.

摘要

背景

下一代测序(NGS)方法产生的大量数据给数据安全、存储和元数据管理带来了各种挑战。尽管有广泛的数据分析管道,但这些挑战至今仍未得到解决。

结果

我们描述了开源元数据管理系统 iRODS(集成面向规则的数据系统)与高性能计算环境中的癌症基因组分析管道的集成。该系统允许自定义元数据属性以及细粒度的保护规则,并通过元数据输入的用户友好前端进行增强。这导致在考虑数据安全性、集中存储和统一元数据信息的情况下,实现了一个健壮、高效的端到端工作流程。

结论

将 iRODS 与 NGS 数据分析管道集成是解决 NGS 环境中数据安全、存储和元数据管理挑战的一种合适方法。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/c2fca55f1b15/12859_2018_2576_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/ad366a1c7c09/12859_2018_2576_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/33b7dfe84d0f/12859_2018_2576_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/c2fca55f1b15/12859_2018_2576_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/ad366a1c7c09/12859_2018_2576_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/33b7dfe84d0f/12859_2018_2576_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acb0/6334444/c2fca55f1b15/12859_2018_2576_Fig3_HTML.jpg

相似文献

1
iRODS metadata management for a cancer genome analysis workflow.iRODS 元数据管理在癌症基因组分析工作流中的应用。
BMC Bioinformatics. 2019 Jan 15;20(1):29. doi: 10.1186/s12859-018-2576-5.
2
Implementing a genomic data management system using iRODS in the Wellcome Trust Sanger Institute.在威康信托桑格研究所使用 iRODS 实施基因组数据管理系统。
BMC Bioinformatics. 2011 Sep 9;12:361. doi: 10.1186/1471-2105-12-361.
3
PGen: large-scale genomic variations analysis workflow and browser in SoyKB.PGen:大豆知识库中的大规模基因组变异分析工作流程与浏览器
BMC Bioinformatics. 2016 Oct 6;17(Suppl 13):337. doi: 10.1186/s12859-016-1227-y.
4
Leveraging the power of high performance computing for next generation sequencing data analysis: tricks and twists from a high throughput exome workflow.利用高性能计算的力量进行下一代测序数据分析:来自高通量外显子组工作流程的技巧与窍门
PLoS One. 2015 May 5;10(5):e0126321. doi: 10.1371/journal.pone.0126321. eCollection 2015.
5
Closha: bioinformatics workflow system for the analysis of massive sequencing data.Closha:用于大规模测序数据分析的生物信息学工作流系统。
BMC Bioinformatics. 2018 Feb 19;19(Suppl 1):43. doi: 10.1186/s12859-018-2019-3.
6
Semi-automated cancer genome analysis using high-performance computing.使用高性能计算进行半自动化癌症基因组分析。
Hum Mutat. 2017 Oct;38(10):1325-1335. doi: 10.1002/humu.23275. Epub 2017 Jul 17.
7
NGS_SNPAnalyzer: a desktop software supporting genome projects by identifying and visualizing sequence variations from next-generation sequencing data.NGS_SNPAnalyzer:一款桌面软件,通过识别和可视化来自下一代测序数据的序列变异,支持基因组项目。
Genes Genomics. 2020 Nov;42(11):1311-1317. doi: 10.1007/s13258-020-00997-7. Epub 2020 Sep 26.
8
systemPipeR: NGS workflow and report generation environment.systemPipeR:二代测序工作流程与报告生成环境。
BMC Bioinformatics. 2016 Sep 20;17:388. doi: 10.1186/s12859-016-1241-0.
9
A framework for organizing cancer-related variations from existing databases, publications and NGS data using a High-performance Integrated Virtual Environment (HIVE).一个使用高性能集成虚拟环境(HIVE)来整理来自现有数据库、出版物和NGS数据的癌症相关变异的框架。
Database (Oxford). 2014 Mar 25;2014:bau022. doi: 10.1093/database/bau022. Print 2014.
10
qPortal: A platform for data-driven biomedical research.qPortal:一个用于数据驱动型生物医学研究的平台。
PLoS One. 2018 Jan 19;13(1):e0191603. doi: 10.1371/journal.pone.0191603. eCollection 2018.

引用本文的文献

1
Accessible viral metagenomics for public health and clinical domains with Jovian.利用 Jovian 实现公共卫生和临床领域的可及性病毒宏基因组学。
Sci Rep. 2024 Oct 29;14(1):26018. doi: 10.1038/s41598-024-73785-y.
2
Somatic rearrangements causing oncogenic ectodomain deletions of FGFR1 in squamous cell lung cancer.导致鳞状细胞肺癌中 FGFR1 致癌外显子缺失的体细胞重排。
J Clin Invest. 2023 Nov 1;133(21):e170217. doi: 10.1172/JCI170217.
3
Shifting Gears in Precision Oncology-Challenges and Opportunities of Integrative Data Analysis.精准肿瘤学的转变——综合数据分析的挑战与机遇。

本文引用的文献

1
CoGe LoadExp+: A web-based suite that integrates next-generation sequencing data analysis workflows and visualization.CoGe LoadExp+:一个集成了下一代测序数据分析工作流程与可视化功能的基于网络的套件。
Plant Direct. 2017 Jul 20;1(2). doi: 10.1002/pld3.8. eCollection 2017 Jul.
2
Copy-number analysis and inference of subclonal populations in cancer genomes using Sclust.使用 Sclust 进行癌症基因组中亚克隆群体的拷贝数分析和推断。
Nat Protoc. 2018 Jun;13(6):1488-1501. doi: 10.1038/nprot.2018.033. Epub 2018 May 24.
3
Integrative genomic profiling of large-cell neuroendocrine carcinomas reveals distinct subtypes of high-grade neuroendocrine lung tumors.
Biomolecules. 2021 Sep 4;11(9):1310. doi: 10.3390/biom11091310.
大细胞神经内分泌癌的综合基因组分析揭示了高级别神经内分泌肺肿瘤的不同亚型。
Nat Commun. 2018 Mar 13;9(1):1048. doi: 10.1038/s41467-018-03099-x.
4
Genomic and Functional Fidelity of Small Cell Lung Cancer Patient-Derived Xenografts.小细胞肺癌患者来源异种移植物的基因组和功能保真度。
Cancer Discov. 2018 May;8(5):600-615. doi: 10.1158/2159-8290.CD-17-0935. Epub 2018 Feb 26.
5
Clonal dynamics towards the development of venetoclax resistance in chronic lymphocytic leukemia.慢性淋巴细胞白血病中对维奈托克耐药性发展的克隆动力学
Nat Commun. 2018 Feb 20;9(1):727. doi: 10.1038/s41467-018-03170-7.
6
Quantification of tumour evolution and heterogeneity via Bayesian epiallele detection.通过贝叶斯表观等位基因检测对肿瘤进化和异质性进行定量分析。
BMC Bioinformatics. 2017 Jul 25;18(1):354. doi: 10.1186/s12859-017-1753-2.
7
Phylogenetic Quantification of Intratumor Heterogeneity.肿瘤内异质性的系统发生定量分析。
Cold Spring Harb Perspect Med. 2018 Apr 2;8(4):a028316. doi: 10.1101/cshperspect.a028316.
8
Telomerase activation by genomic rearrangements in high-risk neuroblastoma.高危神经母细胞瘤中基因组重排导致的端粒酶激活
Nature. 2015 Oct 29;526(7575):700-4. doi: 10.1038/nature14980. Epub 2015 Oct 14.
9
Comprehensive genomic profiles of small cell lung cancer.全面基因组分析小细胞肺癌
Nature. 2015 Aug 6;524(7563):47-53. doi: 10.1038/nature14664. Epub 2015 Jul 13.
10
Leveraging the power of high performance computing for next generation sequencing data analysis: tricks and twists from a high throughput exome workflow.利用高性能计算的力量进行下一代测序数据分析:来自高通量外显子组工作流程的技巧与窍门
PLoS One. 2015 May 5;10(5):e0126321. doi: 10.1371/journal.pone.0126321. eCollection 2015.