机器学习模型中的偏差可以通过仔细的训练得到显著缓解：来自神经影像学研究的证据。

Bias in machine learning models can be significantly mitigated by careful training: Evidence from neuroimaging studies.

机构信息

Department of Electrical and Systems Engineering, University of Pennsylvania, Philadelphia, PA 19104.

Center for Biomedical Image Computing and Analytics, University of Pennsylvania, Philadelphia, PA 19104.

出版信息

Proc Natl Acad Sci U S A. 2023 Feb 7;120(6):e2211613120. doi: 10.1073/pnas.2211613120. Epub 2023 Jan 30.

DOI:10.1073/pnas.2211613120

PMID:36716365

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9962919/

Abstract

Despite the great promise that machine learning has offered in many fields of medicine, it has also raised concerns about potential biases and poor generalization across genders, age distributions, races and ethnicities, hospitals, and data acquisition equipment and protocols. In the current study, and in the context of three brain diseases, we provide evidence which suggests that when properly trained, machine learning models can generalize well across diverse conditions and do not necessarily suffer from bias. Specifically, by using multistudy magnetic resonance imaging consortia for diagnosing Alzheimer's disease, schizophrenia, and autism spectrum disorder, we find that well-trained models have a high area-under-the-curve (AUC) on subjects across different subgroups pertaining to attributes such as gender, age, racial groups and different clinical studies and are unbiased under multiple fairness metrics such as demographic parity difference, equalized odds difference, equal opportunity difference, etc. We find that models that incorporate multisource data from demographic, clinical, genetic factors, and cognitive scores are also unbiased. These models have a better predictive AUC across subgroups than those trained only with imaging features, but there are also situations when these additional features do not help.

摘要

尽管机器学习在医学的许多领域都展现出了巨大的潜力，但它也引发了人们对潜在偏见和在性别、年龄分布、种族和民族、医院以及数据采集设备和协议等方面的泛化能力不足的担忧。在本研究中，我们以三种脑部疾病为例，提供了证据表明，经过适当训练，机器学习模型可以很好地泛化到不同的情况下，并且不一定存在偏见。具体来说，通过使用多研究磁共振成像联盟来诊断阿尔茨海默病、精神分裂症和自闭症谱系障碍，我们发现，经过良好训练的模型在涉及性别、年龄、种族群体和不同临床研究等属性的不同亚组的受试者中具有较高的曲线下面积 (AUC)，并且在多个公平性指标（如人口统计学均等差异、均等机会差异等）下没有偏见。我们还发现，纳入来自人口统计学、临床、遗传因素和认知评分的多源数据的模型也是无偏的。这些模型在亚组中的预测 AUC 优于仅使用成像特征训练的模型，但在某些情况下，这些附加特征并没有帮助。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/adfd/9962919/42c2f48e1b68/pnas.2211613120fig01.jpg

相似文献

Bias in machine learning models can be significantly mitigated by careful training: Evidence from neuroimaging studies.机器学习模型中的偏差可以通过仔细的训练得到显著缓解：来自神经影像学研究的证据。

Proc Natl Acad Sci U S A. 2023 Feb 7;120(6):e2211613120. doi: 10.1073/pnas.2211613120. Epub 2023 Jan 30.

A parameter-efficient deep learning approach to predict conversion from mild cognitive impairment to Alzheimer's disease.一种参数高效的深度学习方法，用于预测轻度认知障碍向阿尔茨海默病的转化。

Neuroimage. 2019 Apr 1;189:276-287. doi: 10.1016/j.neuroimage.2019.01.031. Epub 2019 Jan 14.

Using high-dimensional machine learning methods to estimate an anatomical risk factor for Alzheimer's disease across imaging databases.利用高维机器学习方法在影像数据库中估计阿尔茨海默病的解剖学风险因素。

Neuroimage. 2018 Dec;183:401-411. doi: 10.1016/j.neuroimage.2018.08.040. Epub 2018 Aug 18.

Reproducible neuroimaging features for diagnosis of autism spectrum disorder with machine learning.基于机器学习的自闭症谱系障碍可重现的神经影像学特征。

Sci Rep. 2022 Feb 23;12(1):3057. doi: 10.1038/s41598-022-06459-2.

Supervised machine learning for diagnostic classification from large-scale neuroimaging datasets.基于监督学习的大规模神经影像学数据集的诊断分类。

Brain Imaging Behav. 2020 Dec;14(6):2378-2416. doi: 10.1007/s11682-019-00191-8.

Ten years of image analysis and machine learning competitions in dementia.十年的痴呆症图像分析与机器学习竞赛

Neuroimage. 2022 Jun;253:119083. doi: 10.1016/j.neuroimage.2022.119083. Epub 2022 Mar 9.

Diagnosis of Autism Spectrum Disorder Based on Functional Brain Networks with Deep Learning.基于深度学习的功能脑网络对自闭症谱系障碍的诊断。

J Comput Biol. 2021 Feb;28(2):146-165. doi: 10.1089/cmb.2020.0252. Epub 2020 Oct 19.

Brain MRI Analysis for Alzheimer's Disease Diagnosis Using CNN-Based Feature Extraction and Machine Learning.基于卷积神经网络特征提取和机器学习的阿尔茨海默病脑 MRI 分析用于诊断

Sensors (Basel). 2022 Apr 11;22(8):2911. doi: 10.3390/s22082911.

Comparing different algorithms for the course of Alzheimer's disease using machine learning.使用机器学习比较阿尔茨海默病病程的不同算法。

Ann Palliat Med. 2021 Sep;10(9):9715-9724. doi: 10.21037/apm-21-2013.

Classification of Alzheimer's Disease and Mild Cognitive Impairment Based on Cortical and Subcortical Features from MRI T1 Brain Images Utilizing Four Different Types of Datasets.基于 MRI T1 脑图像的皮质和皮质下特征对阿尔茨海默病和轻度认知障碍的分类，利用了四种不同类型的数据集。

J Healthc Eng. 2020 Aug 31;2020:3743171. doi: 10.1155/2020/3743171. eCollection 2020.

引用本文的文献

Increasing pathogenic germline variant diagnosis rates in precision medicine: current best practices and future opportunities.提高精准医学中致病种系变异的诊断率：当前最佳实践与未来机遇

Hum Genomics. 2025 Aug 22;19(1):97. doi: 10.1186/s40246-025-00811-z.

Towards machine learning fairness in classifying multicategory causes of deaths in colorectal or lung cancer patients.迈向结直肠癌或肺癌患者多类别死亡原因分类中的机器学习公平性。

Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf398.

Artificial Intelligence-Enabled Point-of-Care Echocardiography: Bringing Precision Imaging to the Bedside.人工智能驱动的床旁超声心动图：将精准成像带到床边。

Curr Atheroscler Rep. 2025 Jul 7;27(1):70. doi: 10.1007/s11883-025-01316-9.

Big Data, Small Bias: Harmonizing Diffusion MRI-Based Structural Connectomes to Mitigate Site-Related Bias in Data Integration.大数据，小偏差：协调基于扩散磁共振成像的结构连接组以减轻数据整合中与站点相关的偏差。

Hum Brain Mapp. 2025 Jun 15;46(9):e70256. doi: 10.1002/hbm.70256.

Evidence-based personalised medicine in critical care: a framework for quantifying and applying individualised treatment effects in patients who are critically ill.重症监护中基于证据的个性化医疗：一种用于量化和应用重症患者个体化治疗效果的框架。

Lancet Respir Med. 2025 Jun;13(6):556-568. doi: 10.1016/S2213-2600(25)00054-2. Epub 2025 Apr 15.

Towards machine learning fairness in classifying multicategory causes of deaths in colorectal or lung cancer patients.迈向结直肠癌或肺癌患者多类别死因分类中的机器学习公平性

bioRxiv. 2025 Feb 19:2025.02.14.638368. doi: 10.1101/2025.02.14.638368.

Generative models of MRI-derived neuroimaging features and associated dataset of 18,000 samples.基于MRI的神经影像特征生成模型及包含18000个样本的相关数据集。

Sci Data. 2024 Dec 5;11(1):1330. doi: 10.1038/s41597-024-04157-4.

Addressing fairness issues in deep learning-based medical image analysis: a systematic review.解决基于深度学习的医学图像分析中的公平性问题：一项系统综述。

NPJ Digit Med. 2024 Oct 17;7(1):286. doi: 10.1038/s41746-024-01276-5.

An Investigation into Race Bias in Random Forest Models Based on Breast DCE-MRI Derived Radiomics Features.基于乳腺动态对比增强磁共振成像衍生的影像组学特征对随机森林模型中的种族偏见进行的调查。

Clin Image Based Proced Fairness AI Med Imaging Ethical Philos Issues Med Imaging (2023). 2023;14242:225-234. doi: 10.1007/978-3-031-45249-9_22. Epub 2023 Oct 9.

Comparative analysis of personal protective equipment nonadherence detection: computer vision versus human observers.个人防护装备不依从性检测的比较分析：计算机视觉与人工观察者

J Am Med Inform Assoc. 2025 Jan 1;32(1):163-171. doi: 10.1093/jamia/ocae262.

本文引用的文献

J Med Imaging (Bellingham). 2022 Nov;9(6):061102. doi: 10.1117/1.JMI.9.6.061102. Epub 2022 Aug 26.

Meta-matching as a simple framework to translate phenotypic predictive models from big to small data.元匹配作为一个简单的框架，用于将表型预测模型从大数据转化为小数据。

Nat Neurosci. 2022 Jun;25(6):795-804. doi: 10.1038/s41593-022-01059-9. Epub 2022 May 16.

Population heterogeneity in clinical cohorts affects the predictive accuracy of brain imaging.临床队列中的人群异质性会影响脑影像的预测准确性。

PLoS Biol. 2022 Apr 29;20(4):e3001627. doi: 10.1371/journal.pbio.3001627. eCollection 2022 Apr.

Cross-ethnicity/race generalization failure of behavioral prediction from resting-state functional connectivity.静息态功能连接行为预测在跨种族/民族中的泛化失败

Sci Adv. 2022 Mar 18;8(11):eabj1812. doi: 10.1126/sciadv.abj1812. Epub 2022 Mar 16.

How to remove or control confounds in predictive models, with applications to brain biomarkers.如何在预测模型中去除或控制混杂因素，及其在脑生物标志物中的应用。

Gigascience. 2022 Mar 12;11. doi: 10.1093/gigascience/giac014.

AI in health and medicine.人工智能在医疗中的应用。

Nat Med. 2022 Jan;28(1):31-38. doi: 10.1038/s41591-021-01614-0. Epub 2022 Jan 20.

Underdiagnosis bias of artificial intelligence algorithms applied to chest radiographs in under-served patient populations.人工智能算法应用于服务不足患者人群的胸部 X 光片时的漏诊偏倚。

Nat Med. 2021 Dec;27(12):2176-2182. doi: 10.1038/s41591-021-01595-0. Epub 2021 Dec 10.

The Clinician and Dataset Shift in Artificial Intelligence.临床医生与人工智能中的数据集偏移

N Engl J Med. 2021 Jul 15;385(3):283-286. doi: 10.1056/NEJMc2104626.

Deep transfer learning for reducing health care disparities arising from biomedical data inequality.基于深度迁移学习减少生物医学数据不平等导致的医疗保健差异

Nat Commun. 2020 Oct 12;11(1):5131. doi: 10.1038/s41467-020-18918-3.

The Brain Chart of Aging: Machine-learning analytics reveals links between brain aging, white matter disease, amyloid burden, and cognition in the iSTAGING consortium of 10,216 harmonized MR scans.大脑老化图谱：机器学习分析揭示了 10216 例经过 harmonized MR 扫描的 iSTAGING 联盟中大脑老化、白质疾病、淀粉样蛋白负担与认知之间的关联。

Alzheimers Dement. 2021 Jan;17(1):89-102. doi: 10.1002/alz.12178. Epub 2020 Sep 13.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

机器学习模型中的偏差可以通过仔细的训练得到显著缓解：来自神经影像学研究的证据。

Bias in machine learning models can be significantly mitigated by careful training: Evidence from neuroimaging studies.

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献