基于深度学习预训练的中文电子病历临床命名实体识别。

Clinical Named Entity Recognition from Chinese Electronic Medical Records Based on Deep Learning Pretraining.

机构信息

Jiangsu Key Lab of Big Data Security & Intelligent Processing, School of Computer Science, Nanjing University of Posts and Telecommunications, Nanijing 210023, China.

Zhejiang Engineering Research Center of Intelligent Medicine, Wenzhou 325035, China.

出版信息

J Healthc Eng. 2020 Nov 24;2020:8829219. doi: 10.1155/2020/8829219. eCollection 2020.

DOI:10.1155/2020/8829219

PMID:33299537

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7707942/

Abstract

BACKGROUND

Clinical named entity recognition is the basic task of mining electronic medical records text, which are with some challenges containing the language features of Chinese electronic medical records text with many compound entities, serious missing sentence components, and unclear entity boundary. Moreover, the corpus of Chinese electronic medical records is difficult to obtain.

METHODS

Aiming at these characteristics of Chinese electronic medical records, this study proposed a Chinese clinical entity recognition model based on deep learning pretraining. The model used word embedding from domain corpus and fine-tuning of entity recognition model pretrained by relevant corpus. Then BiLSTM and Transformer are, respectively, used as feature extractors to identify four types of clinical entities including diseases, symptoms, drugs, and operations from the text of Chinese electronic medical records.

RESULTS

75.06% Macro-, 76.40% Macro- and 75.72% Macro-1 aiming at test dataset could be achieved. These experiments show that the Chinese clinical entity recognition model based on deep learning pretraining can effectively improve the recognition effect.

CONCLUSIONS

These experiments show that the proposed Chinese clinical entity recognition model based on deep learning pretraining can effectively improve the recognition performance.

摘要

背景

临床命名实体识别是挖掘电子病历文本的基础任务，其面临一些挑战，包括含有许多复合实体、严重缺失句子成分和实体边界不清晰等中文电子病历文本的语言特征。此外，中文电子病历语料库难以获取。

方法

针对中文电子病历的这些特点，本研究提出了一种基于深度学习预训练的中文临床实体识别模型。该模型使用来自领域语料库的词嵌入，并对相关语料库预训练的实体识别模型进行微调。然后，分别使用 BiLSTM 和 Transformer 作为特征提取器，从中文电子病历的文本中识别出疾病、症状、药物和手术等四种临床实体。

结果

在测试数据集上，分别达到了 75.06%、76.40%和 75.72%的 Macro-，这些实验表明，基于深度学习预训练的中文临床实体识别模型可以有效地提高识别效果。

结论

这些实验表明，所提出的基于深度学习预训练的中文临床实体识别模型可以有效地提高识别性能。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2330/7707942/17c8ed52f11f/JHE2020-8829219.001.jpg

相似文献

Clinical Named Entity Recognition from Chinese Electronic Medical Records Based on Deep Learning Pretraining.基于深度学习预训练的中文电子病历临床命名实体识别。

J Healthc Eng. 2020 Nov 24;2020:8829219. doi: 10.1155/2020/8829219. eCollection 2020.

An attention-based deep learning model for clinical named entity recognition of Chinese electronic medical records.基于注意力的深度学习模型在中文电子病历临床命名实体识别中的应用。

BMC Med Inform Decis Mak. 2019 Dec 5;19(Suppl 5):235. doi: 10.1186/s12911-019-0933-6.

Extracting clinical named entity for pituitary adenomas from Chinese electronic medical records.从中文电子病历中提取垂体腺瘤的临床命名实体。

BMC Med Inform Decis Mak. 2022 Mar 23;22(1):72. doi: 10.1186/s12911-022-01810-z.

A deep learning model incorporating part of speech and self-matching attention for named entity recognition of Chinese electronic medical records.基于词性和自匹配注意力的深度学习模型在中文电子病历命名实体识别中的应用。

BMC Med Inform Decis Mak. 2019 Apr 9;19(Suppl 2):65. doi: 10.1186/s12911-019-0762-7.

Named entity recognition of Chinese electronic medical records based on a hybrid neural network and medical MC-BERT.基于混合神经网络和医学 MC-BERT 的中文电子病历命名实体识别。

BMC Med Inform Decis Mak. 2022 Dec 1;22(1):315. doi: 10.1186/s12911-022-02059-2.

A hybrid approach for named entity recognition in Chinese electronic medical record.中文电子病历命名实体识别的混合方法。

BMC Med Inform Decis Mak. 2019 Apr 9;19(Suppl 2):64. doi: 10.1186/s12911-019-0767-2.

Deep learning-based methods for natural hazard named entity recognition.基于深度学习的自然灾害命名实体识别方法。

Sci Rep. 2022 Mar 17;12(1):4598. doi: 10.1038/s41598-022-08667-2.

An imConvNet-based deep learning model for Chinese medical named entity recognition.基于 imConvNet 的深度学习模型在中文医疗命名实体识别中的应用。

BMC Med Inform Decis Mak. 2022 Nov 21;22(1):303. doi: 10.1186/s12911-022-02049-4.

Chinese Clinical Named Entity Recognition From Electronic Medical Records Based on Multisemantic Features by Using Robustly Optimized Bidirectional Encoder Representation From Transformers Pretraining Approach Whole Word Masking and Convolutional Neural Networks: Model Development and Validation.基于多语义特征，利用经过稳健优化的基于变换器预训练方法的全词掩码和卷积神经网络从电子病历中进行中文临床命名实体识别：模型开发与验证

JMIR Med Inform. 2023 May 10;11:e44597. doi: 10.2196/44597.

Multi-Level Representation Learning for Chinese Medical Entity Recognition: Model Development and Validation.用于中文医学实体识别的多层次表示学习：模型开发与验证

JMIR Med Inform. 2020 May 4;8(5):e17637. doi: 10.2196/17637.

引用本文的文献

Information extraction from green channel textual records on expressways using hybrid deep learning.基于混合深度学习的高速公路绿色通道文本记录信息提取

Sci Rep. 2024 Dec 28;14(1):31269. doi: 10.1038/s41598-024-82681-4.

Chest computed tomography for patients with sepsis in the emergency intensive care unit.急诊重症监护病房脓毒症患者的胸部计算机断层扫描。

Sci Data. 2024 Nov 20;11(1):1261. doi: 10.1038/s41597-024-04132-z.

MF-MNER: Multi-models Fusion for MNER in Chinese Clinical Electronic Medical Records.MF-MNER：中文临床电子病历中的多模型融合命名实体识别。

Interdiscip Sci. 2024 Jun;16(2):489-502. doi: 10.1007/s12539-024-00624-z. Epub 2024 Apr 5.

Natural language processing with machine learning methods to analyze unstructured patient-reported outcomes derived from electronic health records: A systematic review.使用机器学习方法进行自然语言处理，以分析来自电子健康记录的非结构化患者报告结局：系统评价。

Artif Intell Med. 2023 Dec;146:102701. doi: 10.1016/j.artmed.2023.102701. Epub 2023 Nov 1.

A BERT-Span model for Chinese named entity recognition in rehabilitation medicine.一种用于康复医学中文命名实体识别的BERT跨度模型。

PeerJ Comput Sci. 2023 Aug 21;9:e1535. doi: 10.7717/peerj-cs.1535. eCollection 2023.

Establishment of a Chinese critical care database from electronic healthcare records in a tertiary care medical center.建立一个中国重症监护数据库，从三级医疗中心的电子医疗记录。

Sci Data. 2023 Jan 23;10(1):49. doi: 10.1038/s41597-023-01952-3.

BMC Med Inform Decis Mak. 2022 Dec 1;22(1):315. doi: 10.1186/s12911-022-02059-2.

A multi-layer soft lattice based model for Chinese clinical named entity recognition.基于多层软晶格的中文临床命名实体识别模型。

BMC Med Inform Decis Mak. 2022 Jul 30;22(1):201. doi: 10.1186/s12911-022-01924-4.

Deep learning-based methods for natural hazard named entity recognition.基于深度学习的自然灾害命名实体识别方法。

Sci Rep. 2022 Mar 17;12(1):4598. doi: 10.1038/s41598-022-08667-2.

TCMNER and PubMed: A Novel Chinese Character-Level-Based Model and a Dataset for TCM Named Entity Recognition.TCMNER 和 PubMed：一种基于汉字的新型模型和中医命名实体识别数据集。

J Healthc Eng. 2021 Aug 7;2021:3544281. doi: 10.1155/2021/3544281. eCollection 2021.

本文引用的文献

A Guide to Dictionary-Based Text Mining.基于词典的文本挖掘指南。

Methods Mol Biol. 2019;1939:73-89. doi: 10.1007/978-1-4939-9089-4_5.

Combine Factual Medical Knowledge and Distributed Word Representation to Improve Clinical Named Entity Recognition.结合事实医学知识与分布式词表示以改进临床命名实体识别。

AMIA Annu Symp Proc. 2018 Dec 5;2018:1110-1117. eCollection 2018.

A multitask bi-directional RNN model for named entity recognition on Chinese electronic medical records.一种用于中文电子病历命名实体识别的多任务双向 RNN 模型。

BMC Bioinformatics. 2018 Dec 28;19(Suppl 17):499. doi: 10.1186/s12859-018-2467-9.

Clinical Named Entity Recognition From Chinese Electronic Health Records via Machine Learning Methods.基于机器学习方法的中文电子健康记录临床命名实体识别

JMIR Med Inform. 2018 Dec 17;6(4):e50. doi: 10.2196/medinform.9965.

Entity recognition from clinical texts via recurrent neural network.基于循环神经网络的临床文本实体识别。

BMC Med Inform Decis Mak. 2017 Jul 5;17(Suppl 2):67. doi: 10.1186/s12911-017-0468-7.

Disease named entity recognition by combining conditional random fields and bidirectional recurrent neural networks.结合条件随机场和双向递归神经网络的疾病命名实体识别

Database (Oxford). 2016 Oct 24;2016. doi: 10.1093/database/baw140. Print 2016.

Named Entity Recognition in Chinese Clinical Text Using Deep Neural Network.基于深度神经网络的中文临床文本命名实体识别

Stud Health Technol Inform. 2015;216:624-8.

Extracting important information from Chinese Operation Notes with natural language processing methods.运用自然语言处理方法从中文手术记录中提取重要信息。

J Biomed Inform. 2014 Apr;48:130-6. doi: 10.1016/j.jbi.2013.12.017. Epub 2014 Jan 31.

A comprehensive study of named entity recognition in Chinese clinical text.中文临床文本命名实体识别的综合研究。

J Am Med Inform Assoc. 2014 Sep-Oct;21(5):808-14. doi: 10.1136/amiajnl-2013-002381. Epub 2013 Dec 17.

Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: an empirical study.中医自由文本临床记录中症状名称识别的监督方法：一项实证研究。

J Biomed Inform. 2014 Feb;47:91-104. doi: 10.1016/j.jbi.2013.09.008. Epub 2013 Sep 23.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

基于深度学习预训练的中文电子病历临床命名实体识别。

Clinical Named Entity Recognition from Chinese Electronic Medical Records Based on Deep Learning Pretraining.

机构信息

出版信息

BACKGROUND

METHODS

RESULTS

CONCLUSIONS

背景

方法

结果

结论

相似文献

引用本文的文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献