• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

dtoolAI:深度学习的可重复性。

dtoolAI: Reproducibility for Deep Learning.

作者信息

Hartley Matthew, Olsson Tjelvar S G

机构信息

Computational Systems Biology, John Innes Centre, Norwich, Norfolk NR4 7UH, UK.

出版信息

Patterns (N Y). 2020 Jul 23;1(5):100073. doi: 10.1016/j.patter.2020.100073. eCollection 2020 Aug 14.

DOI:10.1016/j.patter.2020.100073
PMID:33205122
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7660391/
Abstract

Deep learning, a set of approaches using artificial neural networks, has generated rapid recent advancements in machine learning. Deep learning does, however, have the potential to reduce the reproducibility of scientific results. Model outputs are critically dependent on the data and processing approach used to initially generate the model, but this provenance information is usually lost during model training. To avoid a future reproducibility crisis, we need to improve our deep-learning model management. The FAIR principles for data stewardship and software/workflow implementation give excellent high-level guidance on ensuring effective reuse of data and software. We suggest some specific guidelines for the generation and use of deep-learning models in science and explain how these relate to the FAIR principles. We then present dtoolAI, a Python package that we have developed to implement these guidelines. The package implements automatic capture of provenance information during model training and simplifies model distribution.

摘要

深度学习是一组使用人工神经网络的方法,近年来在机器学习领域取得了快速进展。然而,深度学习有可能降低科学结果的可重复性。模型输出严重依赖于最初用于生成模型的数据和处理方法,但这些来源信息在模型训练过程中通常会丢失。为避免未来出现可重复性危机,我们需要改进深度学习模型管理。数据管理以及软件/工作流程实施的FAIR原则为确保数据和软件的有效重用提供了出色的高层次指导。我们提出了一些关于科学领域深度学习模型生成和使用的具体指南,并解释了这些指南与FAIR原则的关系。然后,我们介绍了dtoolAI,这是一个我们为实施这些指南而开发的Python包。该包在模型训练期间实现了来源信息的自动捕获,并简化了模型分发。

相似文献

1
dtoolAI: Reproducibility for Deep Learning.dtoolAI:深度学习的可重复性。
Patterns (N Y). 2020 Jul 23;1(5):100073. doi: 10.1016/j.patter.2020.100073. eCollection 2020 Aug 14.
2
CALIFRAME: a proposed method of calibrating reporting guidelines with FAIR principles to foster reproducibility of AI research in medicine.CALIFRAME:一种提议的将报告指南与FAIR原则校准以促进医学人工智能研究可重复性的方法。
JAMIA Open. 2024 Oct 18;7(4):ooae105. doi: 10.1093/jamiaopen/ooae105. eCollection 2024 Dec.
3
Deep convolutional neural network and IoT technology for healthcare.用于医疗保健的深度卷积神经网络和物联网技术。
Digit Health. 2024 Jan 17;10:20552076231220123. doi: 10.1177/20552076231220123. eCollection 2024 Jan-Dec.
4
Object recognition in medical images via anatomy-guided deep learning.通过解剖学引导的深度学习实现医学图像中的目标识别。
Med Image Anal. 2022 Oct;81:102527. doi: 10.1016/j.media.2022.102527. Epub 2022 Jun 25.
5
Open data and algorithms for open science in AI-driven molecular informatics.人工智能驱动的分子信息学中用于开放科学的开放数据和算法。
Curr Opin Struct Biol. 2023 Apr;79:102542. doi: 10.1016/j.sbi.2023.102542. Epub 2023 Feb 17.
6
Sharing interoperable workflow provenance: A review of best practices and their practical application in CWLProv.共享可互操作的工作流溯源:最佳实践综述及其在 CWLProv 中的实际应用。
Gigascience. 2019 Nov 1;8(11). doi: 10.1093/gigascience/giz095.
7
Recording provenance of workflow runs with RO-Crate.使用 RO-Crate 记录工作流运行的出处。
PLoS One. 2024 Sep 10;19(9):e0309210. doi: 10.1371/journal.pone.0309210. eCollection 2024.
8
How Artificial Intelligence and Machine Learning Is Assisting Us to Extract Meaning from Data on Bone Mechanics?人工智能和机器学习如何帮助我们从骨力学数据中提取信息?
Adv Exp Med Biol. 2022;1356:195-221. doi: 10.1007/978-3-030-87779-8_9.
9
Shallow and deep learning classifiers in medical image analysis.医学图像分析中的浅层和深度学习分类器。
Eur Radiol Exp. 2024 Mar 5;8(1):26. doi: 10.1186/s41747-024-00428-2.
10
Artificial intelligence in dermatopathology: Diagnosis, education, and research.人工智能在皮肤病理诊断中的应用:诊断、教育与研究
J Cutan Pathol. 2021 Aug;48(8):1061-1068. doi: 10.1111/cup.13954. Epub 2021 Jan 26.

引用本文的文献

1
Synthetic data and ELSI-focused computational checklists-A survey of biomedical professionals' views.合成数据与聚焦伦理、法律和社会影响的计算清单——生物医学专业人员观点调查
PLOS Digit Health. 2024 Nov 20;3(11):e0000666. doi: 10.1371/journal.pdig.0000666. eCollection 2024 Nov.
2
dtool and dserver: A flexible ecosystem for findable data.dtool 和 dserver:一个用于可发现数据的灵活生态系统。
PLoS One. 2024 Jun 25;19(6):e0306100. doi: 10.1371/journal.pone.0306100. eCollection 2024.
3
The NCI Imaging Data Commons as a platform for reproducible research in computational pathology.

本文引用的文献

1
Definitions, methods, and applications in interpretable machine learning.可解释机器学习中的定义、方法和应用。
Proc Natl Acad Sci U S A. 2019 Oct 29;116(44):22071-22080. doi: 10.1073/pnas.1900654116. Epub 2019 Oct 16.
2
Bringing machine learning to the masses.让机器学习惠及大众。
Science. 2019 Aug 2;365(6452):416-417. doi: 10.1126/science.365.6452.416.
3
Lightweight data management with dtool.使用dtool进行轻量级数据管理。
NCI 成像数据联合组织作为计算病理学中可重复研究的平台。
Comput Methods Programs Biomed. 2023 Dec;242:107839. doi: 10.1016/j.cmpb.2023.107839. Epub 2023 Oct 2.
4
Recent Progress in the Discovery and Design of Antimicrobial Peptides Using Traditional Machine Learning and Deep Learning.利用传统机器学习和深度学习发现与设计抗菌肽的最新进展
Antibiotics (Basel). 2022 Oct 21;11(10):1451. doi: 10.3390/antibiotics11101451.
5
The Effect of COVID-19 on the Perioperative Course of Acute Coronary Syndrome in Poland: The Estimation of Perioperative Prognosis and Neural Network Analysis in 243,515 Cases from 2020 to 2021.2020年至2021年期间243,515例病例中,新型冠状病毒肺炎对波兰急性冠状动脉综合征围手术期病程的影响:围手术期预后评估及神经网络分析
J Clin Med. 2022 Sep 14;11(18):5394. doi: 10.3390/jcm11185394.
6
A scalable phenotyping approach for female floral organ development and senescence in the absence of pollination in wheat.在小麦中不授粉的情况下进行雌性花器官发育和衰老的可扩展表型分析方法。
Development. 2022 Sep 15;149(18). doi: 10.1242/dev.200889.
7
Assessment and Optimization of Explainable Machine Learning Models Applied to Transcriptomic Data.评估和优化应用于转录组数据的可解释机器学习模型。
Genomics Proteomics Bioinformatics. 2022 Oct;20(5):899-911. doi: 10.1016/j.gpb.2022.07.003. Epub 2022 Aug 3.
8
The AI gambit: leveraging artificial intelligence to combat climate change-opportunities, challenges, and recommendations.人工智能策略:利用人工智能应对气候变化——机遇、挑战与建议
AI Soc. 2023;38(1):283-307. doi: 10.1007/s00146-021-01294-x. Epub 2021 Oct 18.
9
Convolutional neural networks (CNNs): concepts and applications in pharmacogenomics.卷积神经网络(CNN):在药物基因组学中的概念与应用。
Mol Divers. 2021 Aug;25(3):1569-1584. doi: 10.1007/s11030-021-10225-3. Epub 2021 May 24.
PeerJ. 2019 Mar 7;7:e6562. doi: 10.7717/peerj.6562. eCollection 2019.
4
A universal SNP and small-indel variant caller using deep neural networks.使用深度神经网络的通用 SNP 和小插入缺失变体调用器。
Nat Biotechnol. 2018 Nov;36(10):983-987. doi: 10.1038/nbt.4235. Epub 2018 Sep 24.
5
Meta-assessment of bias in science.科学偏倚的元评估。
Proc Natl Acad Sci U S A. 2017 Apr 4;114(14):3714-3719. doi: 10.1073/pnas.1618569114. Epub 2017 Mar 20.
6
Deep learning for computational biology.用于计算生物学的深度学习。
Mol Syst Biol. 2016 Jul 29;12(7):878. doi: 10.15252/msb.20156651.
7
A review of bioinformatic pipeline frameworks.生物信息学流程框架综述。
Brief Bioinform. 2017 May 1;18(3):530-536. doi: 10.1093/bib/bbw020.
8
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.
9
PSYCHOLOGY. Estimating the reproducibility of psychological science.心理学. 心理科学可重复性的评估.
Science. 2015 Aug 28;349(6251):aac4716. doi: 10.1126/science.aac4716.
10
Deep learning.深度学习。
Nature. 2015 May 28;521(7553):436-44. doi: 10.1038/nature14539.