消除偶然偏差以最小化泛化误差和最大化可复制性：在连接组学和基因组学中的应用。

Eliminating accidental deviations to minimize generalization error and maximize replicability: Applications in connectomics and genomics.

机构信息

Johns Hopkins University, Baltimore, Maryland, United States of America.

Child Mind Institute, New York, New York, United States of America.

出版信息

PLoS Comput Biol. 2021 Sep 16;17(9):e1009279. doi: 10.1371/journal.pcbi.1009279. eCollection 2021 Sep.

DOI:10.1371/journal.pcbi.1009279

PMID:34529652

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8500408/

Abstract

Replicability, the ability to replicate scientific findings, is a prerequisite for scientific discovery and clinical utility. Troublingly, we are in the midst of a replicability crisis. A key to replicability is that multiple measurements of the same item (e.g., experimental sample or clinical participant) under fixed experimental constraints are relatively similar to one another. Thus, statistics that quantify the relative contributions of accidental deviations-such as measurement error-as compared to systematic deviations-such as individual differences-are critical. We demonstrate that existing replicability statistics, such as intra-class correlation coefficient and fingerprinting, fail to adequately differentiate between accidental and systematic deviations in very simple settings. We therefore propose a novel statistic, discriminability, which quantifies the degree to which an individual's samples are relatively similar to one another, without restricting the data to be univariate, Gaussian, or even Euclidean. Using this statistic, we introduce the possibility of optimizing experimental design via increasing discriminability and prove that optimizing discriminability improves performance bounds in subsequent inference tasks. In extensive simulated and real datasets (focusing on brain imaging and demonstrating on genomics), only optimizing data discriminability improves performance on all subsequent inference tasks for each dataset. We therefore suggest that designing experiments and analyses to optimize discriminability may be a crucial step in solving the replicability crisis, and more generally, mitigating accidental measurement error.

摘要

可重复性，即复制科学发现的能力，是科学发现和临床应用的前提。令人不安的是，我们正处于可重复性危机之中。可重复性的一个关键是，在固定的实验约束下，对同一项目（例如实验样本或临床参与者）的多次测量彼此之间相对相似。因此，量化偶然偏差（例如测量误差）与系统偏差（例如个体差异）相对贡献的统计数据至关重要。我们证明，现有的可重复性统计数据，如组内相关系数和指纹识别，在非常简单的情况下无法充分区分偶然偏差和系统偏差。因此，我们提出了一种新的统计量，可辨别性，它量化了个体样本彼此之间的相对相似程度，而不限制数据为单变量、正态或甚至欧几里得。使用该统计量，我们引入了通过增加可辨别性来优化实验设计的可能性，并证明优化可辨别性可以提高后续推理任务中的性能界限。在广泛的模拟和真实数据集（重点关注脑成像，并在基因组学方面进行了演示）中，只有优化数据的可辨别性才能提高每个数据集所有后续推理任务的性能。因此，我们建议设计实验和分析以优化可辨别性可能是解决可重复性危机的关键步骤，更广泛地说，也是减轻偶然测量误差的关键步骤。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4978/8500408/cb1869691708/pcbi.1009279.g001.jpg

相似文献

Eliminating accidental deviations to minimize generalization error and maximize replicability: Applications in connectomics and genomics.消除偶然偏差以最小化泛化误差和最大化可复制性：在连接组学和基因组学中的应用。

PLoS Comput Biol. 2021 Sep 16;17(9):e1009279. doi: 10.1371/journal.pcbi.1009279. eCollection 2021 Sep.

Accounting for stimulus and participant effects in event-related potential analyses to increase the replicability of studies.在事件相关电位分析中考虑刺激和参与者效应，以提高研究的可重复性。

J Neurosci Methods. 2018 Nov 1;309:218-227. doi: 10.1016/j.jneumeth.2018.09.016. Epub 2018 Sep 16.

The empirical replicability of task-based fMRI as a function of sample size.基于任务的 fMRI 的实证可重复性与样本量的函数关系。

Neuroimage. 2020 May 15;212:116601. doi: 10.1016/j.neuroimage.2020.116601. Epub 2020 Feb 7.

Replication of fMRI group activations in the neuroimaging battery for the Mainz Resilience Project (MARP).在美因茨韧性项目（MARP）的神经影像学电池中复制 fMRI 组激活。

Neuroimage. 2020 Jan 1;204:116223. doi: 10.1016/j.neuroimage.2019.116223. Epub 2019 Sep 23.

Folic acid supplementation and malaria susceptibility and severity among people taking antifolate antimalarial drugs in endemic areas.在流行地区，服用抗叶酸抗疟药物的人群中，叶酸补充剂与疟疾易感性和严重程度的关系。

Cochrane Database Syst Rev. 2022 Feb 1;2(2022):CD014217. doi: 10.1002/14651858.CD014217.

Reproducibility of R-fMRI metrics on the impact of different strategies for multiple comparison correction and sample sizes.不同多重比较校正策略和样本量对 R-fMRI 指标影响的可重复性。

Hum Brain Mapp. 2018 Jan;39(1):300-318. doi: 10.1002/hbm.23843. Epub 2017 Oct 11.

Replicability analysis in genome-wide association studies via Cartesian hidden Markov models.基于笛卡尔隐马尔可夫模型的全基因组关联研究的可重复性分析。

BMC Bioinformatics. 2019 Mar 18;20(1):146. doi: 10.1186/s12859-019-2707-7.

Inferring exemplar discriminability in brain representations.在大脑表征中推断范例可辨别性。

PLoS One. 2020 Jun 10;15(6):e0232551. doi: 10.1371/journal.pone.0232551. eCollection 2020.

Recording human electrocorticographic (ECoG) signals for neuroscientific research and real-time functional cortical mapping.记录用于神经科学研究和实时功能性皮层图谱绘制的人类皮层脑电图（ECoG）信号。

J Vis Exp. 2012 Jun 26(64):3993. doi: 10.3791/3993.

fMRI replicability during emotional scene viewing: Functional regions and sample size.情绪场景观看期间的 fMRI 可重复性：功能区域和样本量。

Psychophysiology. 2022 Jun;59(6):e14000. doi: 10.1111/psyp.14000. Epub 2022 Jan 9.

引用本文的文献

When no answer is better than a wrong answer: A causal perspective on batch effects.当无答案优于错误答案时：批次效应的因果视角

Imaging Neurosci (Camb). 2025 Jan 29;3. doi: 10.1162/imag_a_00458. eCollection 2025.

Challenges in measuring individual differences of brain function.测量脑功能个体差异的挑战。

Imaging Neurosci (Camb). 2025 Jan 7;3. doi: 10.1162/imag_a_00430. eCollection 2025.

Comparing reliability-based measures of functional connectivity between movie and rest: An ROI-based approach.比较基于可靠性的电影与静息状态下功能连接测量：一种基于感兴趣区域的方法。

Imaging Neurosci (Camb). 2025 Jan 2;3. doi: 10.1162/imag_a_00411. eCollection 2025.

Impact of analytic decisions on test-retest reliability of individual and group estimates in functional magnetic resonance imaging: A multiverse analysis using the monetary incentive delay task.分析决策对功能磁共振成像中个体和组估计的重测信度的影响：使用金钱激励延迟任务的多宇宙分析

Imaging Neurosci (Camb). 2024 Sep 10;2. doi: 10.1162/imag_a_00262. eCollection 2024.

Developmental Variations in Recurrent Spatiotemporal Brain Propagations from Childhood to Adulthood.从儿童期到成年期反复出现的时空脑传播的发育变化。

bioRxiv. 2025 Feb 5:2025.02.04.635765. doi: 10.1101/2025.02.04.635765.

Macro-scale patterns in functional connectivity associated with ongoing thought patterns and dispositional traits.与持续思维模式和性格特征相关的功能连接的宏观模式。

Elife. 2024 Nov 20;13:RP93689. doi: 10.7554/eLife.93689.

Why experimental variation in neuroimaging should be embraced.为什么要接受神经影像学中的实验变异。

Nat Commun. 2024 Oct 31;15(1):9411. doi: 10.1038/s41467-024-53743-y.

Moving beyond processing- and analysis-related variation in resting-state functional brain imaging.超越静息态功能脑成像中与处理和分析相关的变异性。

Nat Hum Behav. 2024 Oct;8(10):2003-2017. doi: 10.1038/s41562-024-01942-4. Epub 2024 Aug 5.

Fast connectivity gradient approximation: maintaining spatially fine-grained connectivity gradients while reducing computational costs.快速连接梯度逼近：在降低计算成本的同时保持空间上细粒度的连接梯度。

Commun Biol. 2024 Jun 6;7(1):697. doi: 10.1038/s42003-024-06401-4.

Connectome caricatures: removing large-amplitude co-activation patterns in resting-state fMRI emphasizes individual differences.连接组漫画：去除静息态功能磁共振成像中的大幅共同激活模式可突出个体差异。

bioRxiv. 2024 Apr 11:2024.04.08.588578. doi: 10.1101/2024.04.08.588578.

本文引用的文献

Bagging improves reproducibility of functional parcellation of the human brain.袋装方法提高了人脑功能分区的可重复性。

Neuroimage. 2020 Jul 1;214:116678. doi: 10.1016/j.neuroimage.2020.116678. Epub 2020 Feb 29.

Assessing aneuploidy with repetitive element sequencing.利用重复元件测序评估非整倍体。

Proc Natl Acad Sci U S A. 2020 Mar 3;117(9):4858-4863. doi: 10.1073/pnas.1910041117. Epub 2020 Feb 19.

Harnessing reliability for neuroscience research.利用可靠性进行神经科学研究。

Nat Hum Behav. 2019 Aug;3(8):768-771. doi: 10.1038/s41562-019-0655-x.

Scientific discovery in a model-centric framework: Reproducibility, innovation, and epistemic diversity.基于模型的科学发现框架：可重复性、创新性和认识多样性。

PLoS One. 2019 May 15;14(5):e0216125. doi: 10.1371/journal.pone.0216125. eCollection 2019.

Discovering and deciphering relationships across disparate data modalities.发现和破译不同数据模态之间的关系。

Elife. 2019 Jan 15;8:e41690. doi: 10.7554/eLife.41690.

Influences on the Test-Retest Reliability of Functional Connectivity MRI and its Relationship with Behavioral Utility.功能磁共振成像测试-重测信度的影响及其与行为效用的关系。

Cereb Cortex. 2017 Nov 1;27(11):5415-5429. doi: 10.1093/cercor/bhx230.

The Healthy Brain Network Serial Scanning Initiative: a resource for evaluating inter-individual differences and their reliabilities across scan conditions and sessions.健康大脑网络连续扫描计划：一项用于评估个体间差异及其在不同扫描条件和时段下可靠性的资源。

Gigascience. 2017 Feb 1;6(2):1-14. doi: 10.1093/gigascience/giw011.

The global signal in fMRI: Nuisance or Information?功能磁共振成像中的全局信号：干扰因素还是信息？

Neuroimage. 2017 Apr 15;150:213-229. doi: 10.1016/j.neuroimage.2017.02.036. Epub 2017 Feb 16.

Analysis of Transcriptional Variability in a Large Human iPSC Library Reveals Genetic and Non-genetic Determinants of Heterogeneity.对大型人类诱导多能干细胞库中转录变异性的分析揭示了异质性的遗传和非遗传决定因素。

Cell Stem Cell. 2017 Apr 6;20(4):518-532.e9. doi: 10.1016/j.stem.2016.11.005. Epub 2016 Dec 22.

Towards a consensus regarding global signal regression for resting state functional connectivity MRI.关于静息态功能连接MRI全局信号回归的共识

Neuroimage. 2017 Jul 1;154:169-173. doi: 10.1016/j.neuroimage.2016.11.052. Epub 2016 Nov 22.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

消除偶然偏差以最小化泛化误差和最大化可复制性：在连接组学和基因组学中的应用。

Eliminating accidental deviations to minimize generalization error and maximize replicability: Applications in connectomics and genomics.

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献