通过多输入多输出序列标注模型解析队列查询的临床试验资格标准。

Parsing Clinical Trial Eligibility Criteria for Cohort Query by a Multi-Input Multi-Output Sequence Labeling Model.

作者信息

Tian Shubo, Yin Pengfei, Zhang Hansi, Erdengasileng Arslan, Bian Jiang, He Zhe

机构信息

Department of Statistics, Florida State University, Tallahassee, USA.

Department of Health Outcomes and Biomedical Informatics, University of Florida, Gainesville, USA.

出版信息

Proceedings (IEEE Int Conf Bioinformatics Biomed). 2023 Dec;2023:4426-4430. doi: 10.1109/bibm58861.2023.10385876. Epub 2024 Jan 18.

DOI:10.1109/bibm58861.2023.10385876

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11251129/

Abstract

To enable electronic screening of eligible patients for clinical trials, free-text clinical trial eligibility criteria should be translated to a computable format. Natural language processing (NLP) techniques have the potential to automate this process. In this study, we explored a supervised multi-input multi-output (MIMO) sequence labelling model to parse eligibility criteria into combinations of fact and condition tuples. Our experiments on a small manually annotated training dataset showed that that the performance of the MIMO framework with a BERT-based encoder using all the input sequences achieved an overall lenient-level AUROC of 0.61. Although the performance is suboptimal, representing eligibility criteria into logical and semantically clear tuples can potentially make subsequent translation of these tuples into database queries more reliable.

摘要

为了实现对符合条件的患者进行临床试验的电子筛选，应将自由文本形式的临床试验纳入标准转换为可计算的格式。自然语言处理（NLP）技术有潜力使这一过程自动化。在本研究中，我们探索了一种监督式多输入多输出（MIMO）序列标注模型，以将纳入标准解析为事实和条件元组的组合。我们在一个小型人工标注训练数据集上的实验表明，使用所有输入序列的基于BERT编码器的MIMO框架的性能实现了0.61的总体宽松水平的曲线下面积（AUROC）。尽管性能并不理想，但将纳入标准表示为逻辑和语义清晰的元组可能会使这些元组随后转换为数据库查询更加可靠。

相似文献

1

Parsing Clinical Trial Eligibility Criteria for Cohort Query by a Multi-Input Multi-Output Sequence Labeling Model.通过多输入多输出序列标注模型解析队列查询的临床试验资格标准。

Proceedings (IEEE Int Conf Bioinformatics Biomed). 2023 Dec;2023:4426-4430. doi: 10.1109/bibm58861.2023.10385876. Epub 2024 Jan 18.

2

Transformer-Based Named Entity Recognition for Parsing Clinical Trial Eligibility Criteria.基于Transformer的用于解析临床试验资格标准的命名实体识别

ACM BCB. 2021 Aug;2021. doi: 10.1145/3459930.3469560.

3

Optimizing Clinical Trial Eligibility Design Using Natural Language Processing Models and Real-World Data: Algorithm Development and Validation.使用自然语言处理模型和真实世界数据优化临床试验资格设计：算法开发与验证

JMIR AI. 2024 Jul 29;3:e50800. doi: 10.2196/50800.

4

Folic acid supplementation and malaria susceptibility and severity among people taking antifolate antimalarial drugs in endemic areas.在流行地区，服用抗叶酸抗疟药物的人群中，叶酸补充剂与疟疾易感性和严重程度的关系。

Cochrane Database Syst Rev. 2022 Feb 1;2(2022):CD014217. doi: 10.1002/14651858.CD014217.

5

The Leaf Clinical Trials Corpus: a new resource for query generation from clinical trial eligibility criteria.《叶片临床试验语料库》：一个从临床试验资格标准中生成查询的新资源。

Sci Data. 2022 Aug 11;9(1):490. doi: 10.1038/s41597-022-01521-0.

6

Cohort Selection for Clinical Trials From Longitudinal Patient Records: Text Mining Approach.基于纵向患者记录的临床试验队列选择：文本挖掘方法

JMIR Med Inform. 2019 Oct 31;7(4):e15980. doi: 10.2196/15980.

7

LeafAI: query generator for clinical cohort discovery rivaling a human programmer.LeafAI：用于临床队列发现的查询生成器，可与人类程序员相媲美。

J Am Med Inform Assoc. 2023 Nov 17;30(12):1954-1964. doi: 10.1093/jamia/ocad149.

8

Identification of Semantically Similar Sentences in Clinical Notes: Iterative Intermediate Training Using Multi-Task Learning.临床笔记中语义相似句子的识别：使用多任务学习的迭代中间训练

JMIR Med Inform. 2020 Nov 27;8(11):e22508. doi: 10.2196/22508.

9

Automated classification of clinical trial eligibility criteria text based on ensemble learning and metric learning.基于集成学习和度量学习的临床试验资格标准文本的自动分类。

BMC Med Inform Decis Mak. 2021 Jul 30;21(Suppl 2):129. doi: 10.1186/s12911-021-01492-z.

10

Text Classification of Cancer Clinical Trial Eligibility Criteria.癌症临床试验入选标准的文本分类。

AMIA Annu Symp Proc. 2024 Jan 11;2023:1304-1313. eCollection 2023.

引用本文的文献

1

Enhancing Patient-Trial Matching With Large Language Models: A Scoping Review of Emerging Applications and Approaches.利用大语言模型加强患者与试验匹配：新兴应用与方法的范围综述

JCO Clin Cancer Inform. 2025 Jun;9:e2500071. doi: 10.1200/CCI-25-00071. Epub 2025 Jun 9.

2

AutoCriteria: a generalizable clinical trial eligibility criteria extraction system powered by large language models.AutoCriteria：一个由大型语言模型驱动的可推广的临床试验纳入标准提取系统。

J Am Med Inform Assoc. 2024 Jan 18;31(2):375-385. doi: 10.1093/jamia/ocad218.

本文引用的文献

1

Transformer-Based Named Entity Recognition for Parsing Clinical Trial Eligibility Criteria.基于Transformer的用于解析临床试验资格标准的命名实体识别

ACM BCB. 2021 Aug;2021. doi: 10.1145/3459930.3469560.

2

Chia, a large annotated corpus of clinical trial eligibility criteria.柴亚，一个大型的临床试验资格标准注释语料库。

Sci Data. 2020 Aug 27;7(1):281. doi: 10.1038/s41597-020-00620-0.

3

Clinical Trial Generalizability Assessment in the Big Data Era: A Review.大数据时代临床试验的可推广性评估：综述。

Clin Transl Sci. 2020 Jul;13(4):675-684. doi: 10.1111/cts.12764. Epub 2020 Apr 10.

4

Criteria2Query: a natural language interface to clinical databases for cohort definition.Criteria2Query：一种用于定义队列的临床数据库自然语言接口。

J Am Med Inform Assoc. 2019 Apr 1;26(4):294-305. doi: 10.1093/jamia/ocy178.

5

EliIE: An open-source information extraction system for clinical trial eligibility criteria.EliIE：一个用于临床试验资格标准的开源信息提取系统。

J Am Med Inform Assoc. 2017 Nov 1;24(6):1062-1071. doi: 10.1093/jamia/ocx019.

6

MIMIC-III, a freely accessible critical care database.MIMIC-III，一个免费获取的重症监护数据库。

Sci Data. 2016 May 24;3:160035. doi: 10.1038/sdata.2016.35.

7

Valx: A System for Extracting and Structuring Numeric Lab Test Comparison Statements from Text.Valx：一个用于从文本中提取和构建数字实验室检查比较语句的系统。

Methods Inf Med. 2016 May 17;55(3):266-75. doi: 10.3414/ME15-01-0112. Epub 2016 Mar 4.

8

A European inventory of common electronic health record data elements for clinical trial feasibility.一份用于临床试验可行性的常见电子健康记录数据元素的欧洲清单。

Trials. 2014 Jan 10;15:18. doi: 10.1186/1745-6215-15-18.

9

EliXR: an approach to eligibility criteria extraction and representation.EliXR：一种资格标准提取和表示方法。

J Am Med Inform Assoc. 2011 Dec;18 Suppl 1(Suppl 1):i116-24. doi: 10.1136/amiajnl-2011-000321. Epub 2011 Jul 31.

10

Electronic screening improves efficiency in clinical trial recruitment.电子筛选提高临床试验招募效率。

J Am Med Inform Assoc. 2009 Nov-Dec;16(6):869-73. doi: 10.1197/jamia.M3119. Epub 2009 Aug 28.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验