• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在开放科学时代利用Kerblam!构建数据分析项目!

Structuring data analysis projects in the Open Science era with Kerblam!

作者信息

Visentin Luca, Munaron Luca, Ruffinatti Federico Alessandro

机构信息

Department of Life Sciences and Systems Biology, University of Turin, Turin, 10136, Italy.

出版信息

F1000Res. 2025 Apr 4;14:88. doi: 10.12688/f1000research.157325.1. eCollection 2025.

DOI:10.12688/f1000research.157325.1
PMID:40047014
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11880754/
Abstract

BACKGROUND

Structuring data analysis projects, that is, defining the layout of files and folders needed to analyze data using existing tools and novel code, largely follows personal preferences. Open Science calls for more accessible, transparent and understandable research. We believe that Open Science principles can be applied to the way data analysis projects are structured.

METHODS

We examine the structure of several data analysis project templates by analyzing project template repositories present in GitHub. Through visualization of the resulting consensus structure, we draw observations regarding how the ecosystem of project structures is shaped, and what salient characteristics it has.

RESULTS

Project templates show little overlap, but many distinct practices can be highlighted. We take them into account with the wider Open Science philosophy to draw a few fundamental Design Principles to guide researchers when designing a project space. We present Kerblam!, a project management tool that can work with such a project structure to expedite data handling, execute workflow managers, and share the resulting workflow and analysis outputs with others.

CONCLUSIONS

We hope that, by following these principles and using Kerblam!, the landscape of data analysis projects can become more transparent, understandable, and ultimately useful to the wider community.

摘要

背景

构建数据分析项目,即使用现有工具和新代码定义分析数据所需的文件和文件夹布局,很大程度上遵循个人偏好。开放科学要求开展更易于获取、透明且易懂的研究。我们认为开放科学原则可应用于数据分析项目的构建方式。

方法

我们通过分析GitHub上的项目模板库来研究多个数据分析项目模板的结构。通过可视化最终得出的共识结构,我们对项目结构生态系统的形成方式及其显著特征进行观察。

结果

项目模板几乎没有重叠,但许多不同的做法值得关注。我们将它们与更广泛的开放科学理念相结合,得出一些基本设计原则,以指导研究人员设计项目空间。我们展示了Kerblam!,这是一款项目管理工具,它可以与这样的项目结构配合使用,以加快数据处理、执行工作流管理器,并与他人共享最终的工作流和分析输出。

结论

我们希望,通过遵循这些原则并使用Kerblam!,数据分析项目的格局能够变得更加透明、易懂,并最终对更广泛的群体有用。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3e31/11971619/9c912736f598/f1000research-14-179903-g0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3e31/11971619/59f209451000/f1000research-14-179903-g0000.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3e31/11971619/9c912736f598/f1000research-14-179903-g0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3e31/11971619/59f209451000/f1000research-14-179903-g0000.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/3e31/11971619/9c912736f598/f1000research-14-179903-g0001.jpg

相似文献

1
Structuring data analysis projects in the Open Science era with Kerblam!在开放科学时代利用Kerblam!构建数据分析项目!
F1000Res. 2025 Apr 4;14:88. doi: 10.12688/f1000research.157325.1. eCollection 2025.
2
The Lived Experience of Autistic Adults in Employment: A Systematic Search and Synthesis.成年自闭症患者的就业生活经历:系统检索与综述
Autism Adulthood. 2024 Dec 2;6(4):495-509. doi: 10.1089/aut.2022.0114. eCollection 2024 Dec.
3
Adapting Safety Plans for Autistic Adults with Involvement from the Autism Community.在自闭症群体的参与下为成年自闭症患者调整安全计划。
Autism Adulthood. 2025 May 28;7(3):293-302. doi: 10.1089/aut.2023.0124. eCollection 2025 Jun.
4
Improving the usability of open health service delivery simulation models using Python and web apps.使用Python和网络应用程序提高开放式医疗服务提供模拟模型的可用性。
NIHR Open Res. 2023 Dec 15;3:48. doi: 10.3310/nihropenres.13467.1. eCollection 2023.
5
"In a State of Flow": A Qualitative Examination of Autistic Adults' Phenomenological Experiences of Task Immersion.“心流状态”:对自闭症成年人任务沉浸现象学体验的质性研究
Autism Adulthood. 2024 Sep 16;6(3):362-373. doi: 10.1089/aut.2023.0032. eCollection 2024 Sep.
6
Reducing health inequalities through general practice: a realist review and action framework.通过全科医疗减少健康不平等:一个现实主义综述和行动框架。
Health Soc Care Deliv Res. 2024 Mar;12(7):1-104. doi: 10.3310/YTWW7032.
7
Short-Term Memory Impairment短期记忆障碍
8
How lived experiences of illness trajectories, burdens of treatment, and social inequalities shape service user and caregiver participation in health and social care: a theory-informed qualitative evidence synthesis.疾病轨迹的生活经历、治疗负担和社会不平等如何影响服务使用者和照顾者参与健康和社会护理:一项基于理论的定性证据综合分析
Health Soc Care Deliv Res. 2025 Jun;13(24):1-120. doi: 10.3310/HGTQ8159.
9
"Just Ask What Support We Need": Autistic Adults' Feedback on Social Skills Training.“只需询问我们需要什么支持”:成年自闭症患者对社交技能培训的反馈
Autism Adulthood. 2025 May 28;7(3):283-292. doi: 10.1089/aut.2023.0136. eCollection 2025 Jun.
10
"I Wish This Tool Was Available to Me Sooner": Piloting a Workplace Autism Disclosure Decision-Aid Tool for Autistic Youth and Young Adults.“真希望这个工具能早点提供给我”:为自闭症青少年和青年试行职场自闭症披露决策辅助工具
Autism Adulthood. 2024 Sep 16;6(3):331-344. doi: 10.1089/aut.2023.0054. eCollection 2024 Sep.

本文引用的文献

1
Open science.开放科学。
Curr Biol. 2023 Aug 7;33(15):R792-R797. doi: 10.1016/j.cub.2023.05.036.
2
Introducing the FAIR Principles for research software.提出研究软件的 FAIR 原则。
Sci Data. 2022 Oct 14;9(1):622. doi: 10.1038/s41597-022-01710-x.
3
Challenges for assessing replicability in preclinical cancer biology.评估临床前癌症生物学可重复性面临的挑战。
Elife. 2021 Dec 7;10:e67995. doi: 10.7554/eLife.67995.
4
Sustainable data analysis with Snakemake.使用 Snakemake 进行可持续数据分析。
F1000Res. 2021 Jan 18;10:33. doi: 10.12688/f1000research.29032.2. eCollection 2021.
5
Nextflow enables reproducible computational workflows.Nextflow支持可重复的计算工作流程。
Nat Biotechnol. 2017 Apr 11;35(4):316-319. doi: 10.1038/nbt.3820.
6
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.
7
Why most published research findings are false.为何大多数已发表的研究结果是错误的。
PLoS Med. 2005 Aug;2(8):e124. doi: 10.1371/journal.pmed.0020124. Epub 2005 Aug 30.