• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

关于综合纵向电子健康记录的评估。

On the evaluation of synthetic longitudinal electronic health records.

机构信息

Public Health and Primary Care, Health Campus The Hague, Leiden University Medical Center, Albinusdreef 2, Leiden, South-Holland, 2333ZA, Netherlands.

Leiden Institute of Advanced Computer Science, Leiden University, Einsteinweg 55, Leiden, South-Holland, 2333CC, Netherlands.

出版信息

BMC Med Res Methodol. 2024 Aug 14;24(1):181. doi: 10.1186/s12874-024-02304-4.

DOI:10.1186/s12874-024-02304-4
PMID:39143466
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11323671/
Abstract

BACKGROUND

Synthetic Electronic Health Records (EHRs) are becoming increasingly popular as a privacy enhancing technology. However, for longitudinal EHRs specifically, little research has been done into how to properly evaluate synthetically generated samples. In this article, we provide a discussion on existing methods and recommendations when evaluating the quality of synthetic longitudinal EHRs.

METHODS

We recommend to assess synthetic EHR quality through similarity to real EHRs in low-dimensional projections, accuracy of a classifier discriminating synthetic from real samples, performance of synthetic versus real trained algorithms in clinical tasks, and privacy risk through risk of attribute inference. For each metric we discuss strengths and weaknesses, next to showing how it can be applied on a longitudinal dataset.

RESULTS

To support the discussion on evaluation metrics, we apply discussed metrics on a dataset of synthetic EHRs generated from the Medical Information Mart for Intensive Care-IV (MIMIC-IV) repository.

CONCLUSIONS

The discussion on evaluation metrics provide guidance for researchers on how to use and interpret different metrics when evaluating the quality of synthetic longitudinal EHRs.

摘要

背景

作为一种增强隐私保护的技术,合成电子健康记录(EHR)正变得越来越受欢迎。然而,对于纵向 EHR 具体而言,对于如何正确评估合成生成的样本,几乎没有研究。在本文中,我们将讨论在评估合成纵向 EHR 质量时现有的方法和建议。

方法

我们建议通过在低维投影中与真实 EHR 的相似性、区分合成与真实样本的分类器的准确性、在临床任务中合成与真实训练算法的性能以及通过属性推断的隐私风险来评估合成 EHR 的质量。对于每个指标,我们都讨论了其优缺点,并展示了如何将其应用于纵向数据集。

结果

为了支持对评估指标的讨论,我们将讨论的指标应用于从医疗信息集市重症监护-IV(MIMIC-IV)存储库生成的合成 EHR 数据集。

结论

对评估指标的讨论为研究人员提供了如何在评估合成纵向 EHR 质量时使用和解释不同指标的指导。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/5a458eb1b4f7/12874_2024_2304_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/7dc7b0f2d351/12874_2024_2304_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/82e5fed2011d/12874_2024_2304_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/ff0c242922d2/12874_2024_2304_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/5a458eb1b4f7/12874_2024_2304_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/7dc7b0f2d351/12874_2024_2304_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/82e5fed2011d/12874_2024_2304_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/ff0c242922d2/12874_2024_2304_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/286e/11323671/5a458eb1b4f7/12874_2024_2304_Fig4_HTML.jpg

相似文献

1
On the evaluation of synthetic longitudinal electronic health records.关于综合纵向电子健康记录的评估。
BMC Med Res Methodol. 2024 Aug 14;24(1):181. doi: 10.1186/s12874-024-02304-4.
2
Reliable generation of privacy-preserving synthetic electronic health record time series via diffusion models.通过扩散模型可靠地生成隐私保护的合成电子健康记录时间序列。
J Am Med Inform Assoc. 2024 Nov 1;31(11):2529-2539. doi: 10.1093/jamia/ocae229.
3
Generating sequential electronic health records using dual adversarial autoencoder.使用对偶对抗自动编码器生成连续的电子健康记录。
J Am Med Inform Assoc. 2020 Jul 1;27(9):1411-1419. doi: 10.1093/jamia/ocaa119.
4
Synthesize high-dimensional longitudinal electronic health records via hierarchical autoregressive language model.通过层次自回归语言模型合成高维纵向电子健康记录。
Nat Commun. 2023 Aug 31;14(1):5305. doi: 10.1038/s41467-023-41093-0.
5
Patient and public views about the security and privacy of Electronic Health Records (EHRs) in the UK: results from a mixed methods study.英国患者及公众对电子健康记录(EHRs)安全性和隐私性的看法:一项混合方法研究的结果
BMC Med Inform Decis Mak. 2015 Oct 14;15:86. doi: 10.1186/s12911-015-0202-2.
6
Keeping synthetic patients on track: feedback mechanisms to mitigate performance drift in longitudinal health data simulation.保持合成患者的轨迹:反馈机制以减轻纵向健康数据模拟中的性能漂移。
J Am Med Inform Assoc. 2022 Oct 7;29(11):1890-1898. doi: 10.1093/jamia/ocac131.
7
Data extraction from electronic health records (EHRs) for quality measurement of the physical therapy process: comparison between EHR data and survey data.从电子健康记录(EHRs)中提取数据以进行物理治疗过程的质量测量:EHR数据与调查数据的比较。
BMC Med Inform Decis Mak. 2016 Nov 8;16(1):141. doi: 10.1186/s12911-016-0382-4.
8
Temporal self-attention for risk prediction from electronic health records using non-stationary kernel approximation.使用非平稳核逼近的电子健康记录风险预测的时间自注意力。
Artif Intell Med. 2024 Mar;149:102802. doi: 10.1016/j.artmed.2024.102802. Epub 2024 Feb 10.
9
Public and physician's expectations and ethical concerns about electronic health record: Benefits outweigh risks except for information security.公众和医生对电子健康记录的期望和伦理关注:除了信息安全外,好处大于风险。
Int J Med Inform. 2018 Feb;110:98-107. doi: 10.1016/j.ijmedinf.2017.12.004. Epub 2017 Dec 12.
10
A Framework for Evaluating Synthetic Electronic Health Records.评估合成电子健康记录的框架。
Stud Health Technol Inform. 2023 May 18;302:378-379. doi: 10.3233/SHTI230149.

引用本文的文献

1
Generating synthetic electronic health record data: a methodological scoping review with benchmarking on phenotype data and open-source software.生成合成电子健康记录数据:一项关于表型数据和开源软件基准测试的方法学范围综述
J Am Med Inform Assoc. 2025 Jul 1;32(7):1227-1240. doi: 10.1093/jamia/ocaf082.

本文引用的文献

1
An evaluation of synthetic data augmentation for mitigating covariate bias in health data.评估合成数据增强以减轻健康数据中的协变量偏差。
Patterns (N Y). 2024 Feb 29;5(4):100946. doi: 10.1016/j.patter.2024.100946. eCollection 2024 Apr 12.
2
Harnessing the power of synthetic data in healthcare: innovation, application, and privacy.利用合成数据在医疗保健领域的力量:创新、应用与隐私。
NPJ Digit Med. 2023 Oct 9;6(1):186. doi: 10.1038/s41746-023-00927-3.
3
Synthesize high-dimensional longitudinal electronic health records via hierarchical autoregressive language model.
通过层次自回归语言模型合成高维纵向电子健康记录。
Nat Commun. 2023 Aug 31;14(1):5305. doi: 10.1038/s41467-023-41093-0.
4
Generating synthetic mixed-type longitudinal electronic health records for artificial intelligent applications.为人工智能应用生成合成混合型纵向电子健康记录。
NPJ Digit Med. 2023 May 27;6(1):98. doi: 10.1038/s41746-023-00834-7.
5
Equity and bias in electronic health records data.电子健康记录数据中的公平性和偏差。
Contemp Clin Trials. 2023 Jul;130:107238. doi: 10.1016/j.cct.2023.107238. Epub 2023 May 22.
6
A method for generating synthetic longitudinal health data.一种生成合成纵向健康数据的方法。
BMC Med Res Methodol. 2023 Mar 23;23(1):67. doi: 10.1186/s12874-023-01869-w.
7
MIMIC-IV, a freely accessible electronic health record dataset.MIMIC-IV,一个可自由访问的电子健康记录数据集。
Sci Data. 2023 Jan 3;10(1):1. doi: 10.1038/s41597-022-01899-x.
8
Interpreting area under the receiver operating characteristic curve.解读受试者工作特征曲线下的面积
Lancet Digit Health. 2022 Dec;4(12):e853-e855. doi: 10.1016/S2589-7500(22)00188-1. Epub 2022 Oct 18.
9
DeepMPM: a mortality risk prediction model using longitudinal EHR data.DeepMPM:基于纵向电子健康记录数据的死亡率风险预测模型。
BMC Bioinformatics. 2022 Oct 14;23(1):423. doi: 10.1186/s12859-022-04975-6.
10
Fusion of sequential visits and medical ontology for mortality prediction.基于序列就诊记录和医学本体的死亡率预测融合方法。
J Biomed Inform. 2022 Mar;127:104012. doi: 10.1016/j.jbi.2022.104012. Epub 2022 Feb 7.