Suppr超能文献

从临床文本中进行全面的时间信息检测:医学事件、时间和 TLINK 识别。

Comprehensive temporal information detection from clinical text: medical events, time, and TLINK identification.

机构信息

Division of Biomedical Statistics and Informatics, Mayo Clinic, Rochester, Minnesota, USA.

出版信息

J Am Med Inform Assoc. 2013 Sep-Oct;20(5):836-42. doi: 10.1136/amiajnl-2013-001622. Epub 2013 Apr 4.

Abstract

BACKGROUND

Temporal information detection systems have been developed by the Mayo Clinic for the 2012 i2b2 Natural Language Processing Challenge.

OBJECTIVE

To construct automated systems for EVENT/TIMEX3 extraction and temporal link (TLINK) identification from clinical text.

MATERIALS AND METHODS

The i2b2 organizers provided 190 annotated discharge summaries as the training set and 120 discharge summaries as the test set. Our Event system used a conditional random field classifier with a variety of features including lexical information, natural language elements, and medical ontology. The TIMEX3 system employed a rule-based method using regular expression pattern match and systematic reasoning to determine normalized values. The TLINK system employed both rule-based reasoning and machine learning. All three systems were built in an Apache Unstructured Information Management Architecture framework.

RESULTS

Our TIMEX3 system performed the best (F-measure of 0.900, value accuracy 0.731) among the challenge teams. The Event system produced an F-measure of 0.870, and the TLINK system an F-measure of 0.537.

CONCLUSIONS

Our TIMEX3 system demonstrated good capability of regular expression rules to extract and normalize time information. Event and TLINK machine learning systems required well-defined feature sets to perform well. We could also leverage expert knowledge as part of the machine learning features to further improve TLINK identification performance.

摘要

背景

梅奥诊所已经为 2012 年 i2b2 自然语言处理挑战赛开发了时间信息检测系统。

目的

构建从临床文本中自动提取事件/TIMEX3 和时间链接(TLINK)的系统。

材料和方法

i2b2 组织者提供了 190 份标注的出院小结作为训练集,120 份出院小结作为测试集。我们的事件系统使用条件随机场分类器,具有多种特征,包括词汇信息、自然语言元素和医学本体。TIMEX3 系统采用基于规则的方法,使用正则表达式模式匹配和系统推理来确定标准化值。TLINK 系统采用基于规则的推理和机器学习。所有三个系统都构建在 Apache 非结构化信息管理架构框架中。

结果

在挑战赛团队中,我们的 TIMEX3 系统表现最好(F 度量为 0.900,值准确率为 0.731)。事件系统产生的 F 度量为 0.870,TLINK 系统的 F 度量为 0.537。

结论

我们的 TIMEX3 系统展示了正则表达式规则提取和规范化时间信息的良好能力。事件和 TLINK 机器学习系统需要定义良好的特征集才能表现良好。我们还可以利用专家知识作为机器学习特征的一部分,进一步提高 TLINK 识别性能。

相似文献

2
A hybrid system for temporal information extraction from clinical text.一种从临床文本中提取时间信息的混合系统。
J Am Med Inform Assoc. 2013 Sep-Oct;20(5):828-35. doi: 10.1136/amiajnl-2013-001635. Epub 2013 Apr 9.
5
Evaluating temporal relations in clinical text: 2012 i2b2 Challenge.评估临床文本中的时间关系:2012 i2b2 挑战赛。
J Am Med Inform Assoc. 2013 Sep-Oct;20(5):806-13. doi: 10.1136/amiajnl-2013-001628. Epub 2013 Apr 5.

引用本文的文献

2
Temporal disambiguation of relative temporal expressions in clinical texts.临床文本中相对时间表达的时间消歧
Front Res Metr Anal. 2022 Oct 24;7:1001266. doi: 10.3389/frma.2022.1001266. eCollection 2022.
3
Extraction of Temporal Information from Clinical Narratives.从临床叙述中提取时间信息
J Healthc Inform Res. 2019 Feb 27;3(2):220-244. doi: 10.1007/s41666-019-00049-0. eCollection 2019 Jun.

本文引用的文献

5
Drug side effect extraction from clinical narratives of psychiatry and psychology patients.从精神病学和心理学患者的临床叙述中提取药物副作用。
J Am Med Inform Assoc. 2011 Dec;18 Suppl 1(Suppl 1):i144-9. doi: 10.1136/amiajnl-2011-000351. Epub 2011 Sep 21.
7
2010 i2b2/VA challenge on concepts, assertions, and relations in clinical text.2010 i2b2/VA 挑战赛:临床文本中的概念、断言和关系
J Am Med Inform Assoc. 2011 Sep-Oct;18(5):552-6. doi: 10.1136/amiajnl-2011-000203. Epub 2011 Jun 16.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验