• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Git有助于提高科学研究的可重复性和透明度。

Git can facilitate greater reproducibility and increased transparency in science.

作者信息

Ram Karthik

机构信息

Environmental Science, Policy, and Management, University of California, Berkeley, Berkeley, CA 94720, USA.

出版信息

Source Code Biol Med. 2013 Feb 28;8(1):7. doi: 10.1186/1751-0473-8-7.

DOI:10.1186/1751-0473-8-7
PMID:23448176
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3639880/
Abstract

BACKGROUND

Reproducibility is the hallmark of good science. Maintaining a high degree of transparency in scientific reporting is essential not just for gaining trust and credibility within the scientific community but also for facilitating the development of new ideas. Sharing data and computer code associated with publications is becoming increasingly common, motivated partly in response to data deposition requirements from journals and mandates from funders. Despite this increase in transparency, it is still difficult to reproduce or build upon the findings of most scientific publications without access to a more complete workflow.

FINDINGS

Version control systems (VCS), which have long been used to maintain code repositories in the software industry, are now finding new applications in science. One such open source VCS, Git, provides a lightweight yet robust framework that is ideal for managing the full suite of research outputs such as datasets, statistical code, figures, lab notes, and manuscripts. For individual researchers, Git provides a powerful way to track and compare versions, retrace errors, explore new approaches in a structured manner, while maintaining a full audit trail. For larger collaborative efforts, Git and Git hosting services make it possible for everyone to work asynchronously and merge their contributions at any time, all the while maintaining a complete authorship trail. In this paper I provide an overview of Git along with use-cases that highlight how this tool can be leveraged to make science more reproducible and transparent, foster new collaborations, and support novel uses.

摘要

背景

可重复性是优秀科学的标志。在科学报告中保持高度透明不仅对于在科学界获得信任和信誉至关重要,而且对于促进新思想的发展也必不可少。分享与出版物相关的数据和计算机代码变得越来越普遍,部分原因是为了响应期刊的数据存档要求和资助者的指令。尽管透明度有所提高,但如果没有更完整的工作流程,仍然很难重现或基于大多数科学出版物的研究结果。

研究结果

版本控制系统(VCS)长期以来一直用于软件行业维护代码库,现在在科学领域有了新的应用。一种这样的开源VCS,即Git,提供了一个轻量级但强大的框架,非常适合管理全套研究输出,如数据集、统计代码、图表、实验笔记和手稿。对于个体研究人员来说,Git提供了一种强大的方式来跟踪和比较版本、追溯错误、以结构化方式探索新方法,同时保持完整的审计记录。对于更大规模的合作项目,Git和Git托管服务使每个人都能够异步工作并随时合并他们的贡献,同时始终保持完整的作者记录。在本文中,我将概述Git,并通过一些用例突出展示如何利用这个工具使科学更具可重复性和透明度、促进新的合作以及支持新的应用。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/18fbccbe999d/1751-0473-8-7-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/e6256d4b857b/1751-0473-8-7-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/6e5ce550e3d5/1751-0473-8-7-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/18fbccbe999d/1751-0473-8-7-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/e6256d4b857b/1751-0473-8-7-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/6e5ce550e3d5/1751-0473-8-7-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1313/3639880/18fbccbe999d/1751-0473-8-7-3.jpg

相似文献

1
Git can facilitate greater reproducibility and increased transparency in science.Git有助于提高科学研究的可重复性和透明度。
Source Code Biol Med. 2013 Feb 28;8(1):7. doi: 10.1186/1751-0473-8-7.
2
The FAIRification of research in real-world evidence: A practical introduction to reproducible analytic workflows using Git and R.真实世界证据研究的 FAIR 化:使用 Git 和 R 实现可重复分析工作流程的实用入门
Pharmacoepidemiol Drug Saf. 2024 Jan;33(1):e5740. doi: 10.1002/pds.5740. Epub 2024 Jan 3.
3
DataPackageR: Reproducible data preprocessing, standardization and sharing using R/Bioconductor for collaborative data analysis.DataPackageR:使用R/Bioconductor进行可重复的数据预处理、标准化和共享,以实现协作式数据分析。
Gates Open Res. 2018 Jul 10;2:31. doi: 10.12688/gatesopenres.12832.2. eCollection 2018.
4
Macromolecular crowding: chemistry and physics meet biology (Ascona, Switzerland, 10-14 June 2012).大分子拥挤现象:化学与物理邂逅生物学(瑞士阿斯科纳,2012年6月10日至14日)
Phys Biol. 2013 Aug;10(4):040301. doi: 10.1088/1478-3975/10/4/040301. Epub 2013 Aug 2.
5
The future of Cochrane Neonatal.考克兰新生儿协作网的未来。
Early Hum Dev. 2020 Nov;150:105191. doi: 10.1016/j.earlhumdev.2020.105191. Epub 2020 Sep 12.
6
Open science, reproducibility, and transparency in ecology.生态学中的开放科学、可重复性和透明度。
Ecol Appl. 2019 Jan;29(1):e01822. doi: 10.1002/eap.1822. Epub 2018 Nov 30.
7
Analytical code sharing practices in biomedical research.生物医学研究中的分析代码共享实践。
PeerJ Comput Sci. 2024 Jun 28;10:e2066. doi: 10.7717/peerj-cs.2066. eCollection 2024.
8
Transparent, Open, and Reproducible Prevention Science.透明、开放、可重现的预防科学。
Prev Sci. 2022 Jul;23(5):701-722. doi: 10.1007/s11121-022-01336-w. Epub 2022 Feb 17.
9
A Guide and Toolbox to Replicability and Open Science in Entomology.昆虫学中可重复性与开放科学指南及工具箱
J Insect Sci. 2020 May 1;20(3). doi: 10.1093/jisesa/ieaa036.
10
Creating and sharing reproducible research code the workflowr way.以workflowr方式创建和共享可重复的研究代码。
F1000Res. 2019 Oct 14;8:1749. doi: 10.12688/f1000research.20843.1. eCollection 2019.

引用本文的文献

1
Enabling transparent toxicokinetic modeling for public health risk assessment.实现用于公共卫生风险评估的透明毒代动力学建模。
PLoS One. 2025 Apr 16;20(4):e0321321. doi: 10.1371/journal.pone.0321321. eCollection 2025.
2
GitHub is an effective platform for collaborative and reproducible laboratory research.GitHub是一个用于协作和可重复的实验室研究的有效平台。
ArXiv. 2025 Feb 10:arXiv:2408.09344v2.
3
GitHub enables collaborative and reproducible laboratory research.GitHub支持协作式和可重复的实验室研究。

本文引用的文献

1
Best practices for scientific computing.科学计算的最佳实践。
PLoS Biol. 2014 Jan;12(1):e1001745. doi: 10.1371/journal.pbio.1001745. Epub 2014 Jan 7.
2
The case for open preprints in biology.生物学中开放预印本的案例。
PLoS Biol. 2013;11(5):e1001563. doi: 10.1371/journal.pbio.1001563. Epub 2013 May 14.
3
Altmetrics: Value all research products.替代计量学:重视所有研究成果。
PLoS Biol. 2025 Feb 14;23(2):e3003029. doi: 10.1371/journal.pbio.3003029. eCollection 2025 Feb.
4
Affording reusable data: recommendations for researchers from a data-intensive project.提供可重复使用的数据:来自一个数据密集型项目给研究人员的建议。
Sci Data. 2025 Feb 12;12(1):258. doi: 10.1038/s41597-025-04565-0.
5
ENCORE: a practical implementation to improve reproducibility and transparency of computational research.ENCORE:一种提高计算研究可重复性和透明度的实际实施方案。
Nat Commun. 2024 Sep 16;15(1):8117. doi: 10.1038/s41467-024-52446-8.
6
A how-to guide for code sharing in biology.生物学代码共享指南
PLoS Biol. 2024 Sep 10;22(9):e3002815. doi: 10.1371/journal.pbio.3002815. eCollection 2024 Sep.
7
Nine quick tips for open meta-analyses.九条开放元分析的快速提示。
PLoS Comput Biol. 2024 Jul 25;20(7):e1012252. doi: 10.1371/journal.pcbi.1012252. eCollection 2024 Jul.
8
Introducing SpectraFit: An Open-Source Tool for Interactive Spectral Analysis.介绍SpectraFit:一款用于交互式光谱分析的开源工具。
ACS Omega. 2024 May 20;9(22):23252-23265. doi: 10.1021/acsomega.3c09262. eCollection 2024 Jun 4.
9
SciDataFlow: a tool for improving the flow of data through science.SciDataFlow:一种提高科学数据流通效率的工具。
Bioinformatics. 2024 Jan 2;40(1). doi: 10.1093/bioinformatics/btad754.
10
The five pillars of computational reproducibility: bioinformatics and beyond.计算可重复性的五个支柱:生物信息学及其他。
Brief Bioinform. 2023 Sep 22;24(6). doi: 10.1093/bib/bbad375.
Nature. 2013 Jan 10;493(7431):159. doi: 10.1038/493159a.
4
Mandated data archiving greatly improves access to research data.强制数据归档大大提高了研究数据的可访问性。
FASEB J. 2013 Apr;27(4):1304-8. doi: 10.1096/fj.12-218164. Epub 2013 Jan 3.
5
Science publishing: Open access must enable open use.科学出版:开放获取必须实现开放使用。
Nature. 2012 Dec 20;492(7429):348-9. doi: 10.1038/492348a.
6
Ten simple rules for the open development of scientific software.科学软件开放开发的十条简单规则。
PLoS Comput Biol. 2012;8(12):e1002802. doi: 10.1371/journal.pcbi.1002802. Epub 2012 Dec 6.
7
mMass as a software tool for the annotation of cyclic peptide tandem mass spectra.mMass 软件工具用于环状肽串联质谱的注释。
PLoS One. 2012;7(9):e44913. doi: 10.1371/journal.pone.0044913. Epub 2012 Sep 13.
8
Ending honorary authorship.终结荣誉作者身份。
Science. 2012 Aug 31;337(6098):1019. doi: 10.1126/science.1224988.
9
A quick guide to software licensing for the scientist-programmer.给科学家程序员的软件许可快速指南。
PLoS Comput Biol. 2012;8(7):e1002598. doi: 10.1371/journal.pcbi.1002598. Epub 2012 Jul 26.
10
Drug development: Raise standards for preclinical cancer research.药物研发:提高临床前癌症研究标准。
Nature. 2012 Mar 28;483(7391):531-3. doi: 10.1038/483531a.