• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SeqTrial:实用程序保留顺序临床试验数据生成器。

SeqTrial: Utility Preserving Sequential Clinical Trial Data Generator.

作者信息

Das Trisha, Shafquat Afrah, Beigi Mandis, Aptekar Jacob, Mezey Jason, Sun Jimeng

机构信息

University of Illinois Urbana-Champaign, Urbana, IL.

Medidata, New York, NY.

出版信息

AMIA Annu Symp Proc. 2025 May 22;2024:329-338. eCollection 2024.

PMID:40417577
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC12099387/
Abstract

Clinical trial data used to evaluate new treatments have value beyond the original studies, but limitations in data access due to privacy concerns make further use of these data challenging. Digital twins offer a solution by simulating patient outcomes, providing less restricted data access, reducing costs and increasing sample sizes. However, existing research focuses on synthetic Electronic Healthcare Records (EHRs) and lacks personalized patient record generation. This paper introduces SeqTrial, a framework for generating personalized digital twins for sequential clinical trial event data. The method uses BioBERT word embeddings to capture biomedical term semantics, an attention mechanism to understand visit relationships, and synthesizes digital twins for each patient. SeqTrial generates utility-preserving digital twins capable of estimating clinical outcomes, while addressing data scarcity through self-supervised pretraining. The method demonstrates high fidelity and utility in generating synthetic sequential clinical trial data for patient outcome prediction while ensuring privacy protection. The code is available at.

摘要

用于评估新疗法的临床试验数据具有超出原始研究的价值,但由于隐私问题导致的数据访问限制使得进一步利用这些数据具有挑战性。数字孪生通过模拟患者预后提供了一种解决方案,可提供限制较少的数据访问、降低成本并增加样本量。然而,现有研究集中在合成电子健康记录(EHR)上,缺乏个性化患者记录生成。本文介绍了SeqTrial,这是一个为序贯临床试验事件数据生成个性化数字孪生的框架。该方法使用BioBERT词嵌入来捕捉生物医学术语语义,使用注意力机制来理解就诊关系,并为每个患者合成数字孪生。SeqTrial生成能够估计临床预后的保留效用的数字孪生,同时通过自监督预训练解决数据稀缺问题。该方法在生成用于患者预后预测的合成序贯临床试验数据时展示了高保真度和效用,同时确保了隐私保护。代码可在……获取。

相似文献

1
SeqTrial: Utility Preserving Sequential Clinical Trial Data Generator.SeqTrial:实用程序保留顺序临床试验数据生成器。
AMIA Annu Symp Proc. 2025 May 22;2024:329-338. eCollection 2024.
2
Reliable generation of privacy-preserving synthetic electronic health record time series via diffusion models.通过扩散模型可靠地生成隐私保护的合成电子健康记录时间序列。
J Am Med Inform Assoc. 2024 Nov 1;31(11):2529-2539. doi: 10.1093/jamia/ocae229.
3
Domain Knowledge-Driven Generation of Synthetic Healthcare Data.基于领域知识的合成医疗保健数据生成。
Stud Health Technol Inform. 2023 May 18;302:352-353. doi: 10.3233/SHTI230136.
4
Privacy-preserving Sequential Pattern Mining in distributed EHRs for Predicting Cardiovascular Disease.分布式电子健康记录中的隐私保护序列模式挖掘用于预测心血管疾病。
AMIA Jt Summits Transl Sci Proc. 2021 May 17;2021:384-393. eCollection 2021.
5
Impact of patient access to their electronic health record: systematic review.患者获取电子健康记录的影响:系统评价。
Inform Health Soc Care. 2021 Jun 2;46(2):192-204. doi: 10.1080/17538157.2021.1879810. Epub 2021 Apr 10.
6
A framework for privacy-preserving access to next-generation EHRs.一种用于保护隐私地访问下一代电子健康记录的框架。
Stud Health Technol Inform. 2014;205:740-4.
7
SynTEG: a framework for temporal structured electronic health data simulation.SynTEG:用于时间结构化电子健康数据模拟的框架。
J Am Med Inform Assoc. 2021 Mar 1;28(3):596-604. doi: 10.1093/jamia/ocaa262.
8
Preserving privacy in healthcare: A systematic review of deep learning approaches for synthetic data generation.医疗保健中的隐私保护:对用于合成数据生成的深度学习方法的系统综述。
Comput Methods Programs Biomed. 2025 Mar;260:108571. doi: 10.1016/j.cmpb.2024.108571. Epub 2024 Dec 28.
9
Synthesize high-dimensional longitudinal electronic health records via hierarchical autoregressive language model.通过层次自回归语言模型合成高维纵向电子健康记录。
Nat Commun. 2023 Aug 31;14(1):5305. doi: 10.1038/s41467-023-41093-0.
10
Preserving Patient Privacy During Computation over Shared Electronic Health Record Data.在共享电子健康记录数据的计算过程中保护患者隐私。
J Med Syst. 2022 Oct 20;46(12):85. doi: 10.1007/s10916-022-01865-5.

本文引用的文献

1
PromptEHR: Conditional Electronic Healthcare Records Generation with Prompt Learning.PromptEHR:基于提示学习的条件式电子健康记录生成
Proc Conf Empir Methods Nat Lang Process. 2022 Dec;2022:2873-2885. doi: 10.18653/v1/2022.emnlp-main.185.
2
Simulants: Synthetic Clinical Trial Data via Subject-Level Privacy-Preserving Synthesis.模拟物:通过基于受试者的隐私保护综合方法生成的合成临床试验数据。
AMIA Annu Symp Proc. 2023 Apr 29;2022:231-240. eCollection 2022.
3
Can synthetic data be a proxy for real clinical trial data? A validation study.合成数据能否替代真实的临床试验数据?一项验证性研究。
BMJ Open. 2021 Apr 16;11(4):e043497. doi: 10.1136/bmjopen-2020-043497.
4
SynTEG: a framework for temporal structured electronic health data simulation.SynTEG:用于时间结构化电子健康数据模拟的框架。
J Am Med Inform Assoc. 2021 Mar 1;28(3):596-604. doi: 10.1093/jamia/ocaa262.
5
Optimizing the synthesis of clinical trial data using sequential trees.使用序贯树优化临床试验数据的合成
J Am Med Inform Assoc. 2021 Jan 15;28(1):3-13. doi: 10.1093/jamia/ocaa249.
6
Generating sequential electronic health records using dual adversarial autoencoder.使用对偶对抗自动编码器生成连续的电子健康记录。
J Am Med Inform Assoc. 2020 Jul 1;27(9):1411-1419. doi: 10.1093/jamia/ocaa119.
7
BioBERT: a pre-trained biomedical language representation model for biomedical text mining.BioBERT:一种用于生物医学文本挖掘的预训练生物医学语言表示模型。
Bioinformatics. 2020 Feb 15;36(4):1234-1240. doi: 10.1093/bioinformatics/btz682.
8
Synthesizing electronic health records using improved generative adversarial networks.使用改进的生成对抗网络合成电子健康记录。
J Am Med Inform Assoc. 2019 Mar 1;26(3):228-241. doi: 10.1093/jamia/ocy142.
9
Data too important to share: do those who control the data control the message?数据太过重要而不宜分享:掌控数据的人是否也掌控了信息?
BMJ. 2016 Mar 2;352:i1027. doi: 10.1136/bmj.i1027.
10
The project data sphere initiative: accelerating cancer research by sharing data.项目数据领域计划:通过数据共享加速癌症研究
Oncologist. 2015 May;20(5):464-e20. doi: 10.1634/theoncologist.2014-0431. Epub 2015 Apr 15.