• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

创建可重现的药物基因组学分析管道。

Creating reproducible pharmacogenomic analysis pipelines.

机构信息

Princess Margaret Cancer Centre, University Health Network, Toronto, Ontario, Canada.

Department of Medical Biophysics, University of Toronto, Toronto, Ontario, Canada.

出版信息

Sci Data. 2019 Sep 3;6(1):166. doi: 10.1038/s41597-019-0174-7.

DOI:10.1038/s41597-019-0174-7
PMID:31481707
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6722117/
Abstract

The field of pharmacogenomics presents great challenges for researchers that are willing to make their studies reproducible and shareable. This is attributed to the generation of large volumes of high-throughput multimodal data, and the lack of standardized workflows that are robust, scalable, and flexible to perform large-scale analyses. To address this issue, we developed pharmacogenomic workflows in the Common Workflow Language to process two breast cancer datasets in a reproducible and transparent manner. Our pipelines combine both pharmacological and molecular profiles into a portable data object that can be used for future analyses in cancer research. Our data objects and workflows are shared on Harvard Dataverse and Code Ocean where they have been assigned a unique Digital Object Identifier, providing a level of data provenance and a persistent location to access and share our data with the community.

摘要

药物基因组学领域为那些希望使研究具有可重复性和可共享性的研究人员带来了巨大的挑战。这归因于大量高通量多模态数据的产生,以及缺乏稳健、可扩展且灵活的标准化工作流程来执行大规模分析。为了解决这个问题,我们在通用工作流程语言中开发了药物基因组学工作流程,以可重复和透明的方式处理两个乳腺癌数据集。我们的管道将药理学和分子谱组合成一个可移植的数据对象,可用于癌症研究的未来分析。我们的数据对象和工作流程已在哈佛数据共享平台和 CodeOcean 上共享,它们被分配了一个唯一的数字对象标识符,为数据来源提供了一个级别,并为访问和与社区共享我们的数据提供了一个持久的位置。

相似文献

1
Creating reproducible pharmacogenomic analysis pipelines.创建可重现的药物基因组学分析管道。
Sci Data. 2019 Sep 3;6(1):166. doi: 10.1038/s41597-019-0174-7.
2
Scalable Workflows and Reproducible Data Analysis for Genomics.基因组学的可扩展工作流程和可重复数据分析
Methods Mol Biol. 2019;1910:723-745. doi: 10.1007/978-1-4939-9074-0_24.
3
Reproducible, scalable, and shareable analysis pipelines with bioinformatics workflow managers.使用生物信息学工作流管理器的可重复、可扩展且可共享的分析管道。
Nat Methods. 2021 Oct;18(10):1161-1168. doi: 10.1038/s41592-021-01254-9. Epub 2021 Sep 23.
4
Tibanna: software for scalable execution of portable pipelines on the cloud.Tibanna:用于在云端可扩展执行可移植管道的软件。
Bioinformatics. 2019 Nov 1;35(21):4424-4426. doi: 10.1093/bioinformatics/btz379.
5
Sharing interoperable workflow provenance: A review of best practices and their practical application in CWLProv.共享可互操作的工作流溯源:最佳实践综述及其在 CWLProv 中的实际应用。
Gigascience. 2019 Nov 1;8(11). doi: 10.1093/gigascience/giz095.
6
Watchdog - a workflow management system for the distributed analysis of large-scale experimental data.Watchdog - 一种用于大规模实验数据分析的分布式工作流管理系统。
BMC Bioinformatics. 2018 Mar 13;19(1):97. doi: 10.1186/s12859-018-2107-4.
7
Sapporo: A workflow execution service that encourages the reuse of workflows in various languages in bioinformatics.札幌:一个工作流执行服务,鼓励在生物信息学中重用各种语言的工作流。
F1000Res. 2024 Jun 24;11:889. doi: 10.12688/f1000research.122924.2. eCollection 2022.
8
FAIR digital objects in environmental and life sciences should comprise workflow operation design data and method information for repeatability of study setups and reproducibility of results.环境与生命科学领域的FAIR数字对象应包含工作流程操作设计数据和方法信息,以实现研究设置的可重复性和结果的可再现性。
Database (Oxford). 2020 Jan 1;2020. doi: 10.1093/database/baaa059.
9
Reusable, extensible, and modifiable R scripts and Kepler workflows for comprehensive single set ChIP-seq analysis.用于全面单组ChIP-seq分析的可重复使用、可扩展且可修改的R脚本和开普勒工作流程。
BMC Bioinformatics. 2016 Jul 5;17(1):270. doi: 10.1186/s12859-016-1125-3.
10
System for Quality-Assured Data Analysis: Flexible, reproducible scientific workflows.质量保证数据分析系统:灵活、可重复的科学工作流程。
Genet Epidemiol. 2019 Mar;43(2):227-237. doi: 10.1002/gepi.22178. Epub 2018 Dec 18.

引用本文的文献

1
Computational Modeling of Drug Response Identifies Mutant-Specific Constraints for Dosing panRAF and MEK Inhibitors in Melanoma.药物反应的计算模型确定了黑色素瘤中泛RAF和MEK抑制剂给药的突变特异性限制因素。
Cancers (Basel). 2024 Aug 22;16(16):2914. doi: 10.3390/cancers16162914.
2
Computational modeling of drug response identifies mutant-specific constraints for dosing panRAF and MEK inhibitors in melanoma.药物反应的计算模型确定了黑色素瘤中泛RAF和MEK抑制剂给药的突变特异性限制因素。
bioRxiv. 2024 Aug 6:2024.08.02.606432. doi: 10.1101/2024.08.02.606432.
3
Toward a common standard for data and specimen provenance in life sciences.

本文引用的文献

1
Modeling Cellular Response in Large-Scale Radiogenomic Databases to Advance Precision Radiotherapy.基于大规模放射基因组学数据库的细胞反应建模,以推进精准放射治疗。
Cancer Res. 2019 Dec 15;79(24):6227-6237. doi: 10.1158/0008-5472.CAN-19-0179. Epub 2019 Sep 26.
2
Next-generation characterization of the Cancer Cell Line Encyclopedia.下一代癌症细胞系百科全书的特征描述。
Nature. 2019 May;569(7757):503-508. doi: 10.1038/s41586-019-1186-3. Epub 2019 May 8.
3
Network-based approach to identify principal isoforms among four cancer types.
迈向生命科学领域数据与样本来源的通用标准。
Learn Health Syst. 2023 Apr 18;8(1):e10365. doi: 10.1002/lrh2.10365. eCollection 2024 Jan.
4
Data platforms for open life sciences-A systematic analysis of management instruments.开放生命科学的数据平台——管理工具的系统分析。
PLoS One. 2022 Oct 25;17(10):e0276204. doi: 10.1371/journal.pone.0276204. eCollection 2022.
5
Lightweight Distributed Provenance Model for Complex Real-world Environments.轻量级分布式 Provenance 模型用于复杂的真实环境。
Sci Data. 2022 Aug 17;9(1):503. doi: 10.1038/s41597-022-01537-6.
基于网络的方法来鉴定四种癌症类型中的主要异构体。
Mol Omics. 2019 Apr 1;15(2):117-129. doi: 10.1039/c8mo00234g. Epub 2019 Feb 5.
4
Container-based bioinformatics with Pachyderm.基于容器的生物信息学与 Pachyderm。
Bioinformatics. 2019 Mar 1;35(5):839-846. doi: 10.1093/bioinformatics/bty699.
5
PharmacoDB: an integrative database for mining in vitro anticancer drug screening studies.PharmacoDB:一个用于挖掘体外抗癌药物筛选研究的综合数据库。
Nucleic Acids Res. 2018 Jan 4;46(D1):D994-D1002. doi: 10.1093/nar/gkx911.
6
The High-Throughput Analyses Era: Are We Ready for the Data Struggle?高通量分析时代:我们准备好应对数据难题了吗?
High Throughput. 2018 Mar 2;7(1):8. doi: 10.3390/ht7010008.
7
PharmGKB: A worldwide resource for pharmacogenomic information.PharmGKB:一个全球性的药物基因组学信息资源。
Wiley Interdiscip Rev Syst Biol Med. 2018 Jul;10(4):e1417. doi: 10.1002/wsbm.1417. Epub 2018 Feb 23.
8
BGDMdocker: a Docker workflow for data mining and visualization of bacterial pan-genomes and biosynthetic gene clusters.BGDMdocker:一种用于细菌泛基因组和生物合成基因簇数据挖掘与可视化的Docker工作流程。
PeerJ. 2017 Nov 30;5:e3948. doi: 10.7717/peerj.3948. eCollection 2017.
9
Quantification of sensitivity and resistance of breast cancer cell lines to anti-cancer drugs using GR metrics.使用 GR 指标定量检测乳腺癌细胞系对抗癌药物的敏感性和耐药性。
Sci Data. 2017 Nov 7;4:170166. doi: 10.1038/sdata.2017.166.
10
Gene isoforms as expression-based biomarkers predictive of drug response in vitro.基因亚型作为基于表达的生物标志物,可预测体外药物反应。
Nat Commun. 2017 Oct 24;8(1):1126. doi: 10.1038/s41467-017-01153-8.