• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于伪标签注意力网络的 ICD 自动编码方法。

A Pseudo Label-Wise Attention Network for Automatic ICD Coding.

出版信息

IEEE J Biomed Health Inform. 2022 Oct;26(10):5201-5212. doi: 10.1109/JBHI.2022.3193291. Epub 2022 Oct 5.

DOI:10.1109/JBHI.2022.3193291
PMID:35867367
Abstract

Automatic International Classification of Diseases (ICD) coding is defined as a kind of text multi-label classification problem, which is difficult because the number of labels is very large and the distribution of labels is unbalanced. The label-wise attention mechanism is widely used in automatic ICD coding because it can assign weights to every word in full Electronic Medical Records (EMR) for different ICD codes. However, the label-wise attention mechanism is redundant and costly in computing. In this paper, we propose a pseudo label-wise attention mechanism to tackle the problem. Instead of computing different attention modes for different ICD codes, the pseudo label-wise attention mechanism automatically merges similar ICD codes and computes only one attention mode for the similar ICD codes, which greatly compresses the number of attention modes and improves the predicted accuracy. In addition, we apply a more convenient and effective way to obtain the ICD vectors, and thus our model can predict new ICD codes by calculating the similarities between EMR vectors and ICD vectors. Our model demonstrates effectiveness in extensive computational experiments. On the public MIMIC-III dataset and private Xiangya dataset, our model achieves the best performance on micro F1 (0.583 and 0.806), micro AUC (0.986 and 0.994), P@8 (0.756 and 0.413), and costs much smaller GPU memory (about 26.1% of the models with label-wise attention). Furthermore, we verify the ability of our model in predicting new ICD codes. The interpretablility analysis and case study show the effectiveness and reliability of the patterns obtained by the pseudo label-wise attention mechanism.

摘要

自动国际疾病分类 (ICD) 编码被定义为一种文本多标签分类问题,由于标签数量非常大且标签分布不平衡,因此具有一定难度。标签注意力机制在自动 ICD 编码中得到了广泛应用,因为它可以为电子病历 (EMR) 中的每个单词分配不同 ICD 码的权重。然而,标签注意力机制在计算上是冗余且昂贵的。在本文中,我们提出了一种伪标签注意力机制来解决这个问题。与为不同的 ICD 码计算不同的注意力模式不同,伪标签注意力机制自动合并相似的 ICD 码,并为相似的 ICD 码仅计算一个注意力模式,这大大压缩了注意力模式的数量,并提高了预测准确性。此外,我们应用了一种更方便有效的方法来获取 ICD 向量,因此我们的模型可以通过计算 EMR 向量和 ICD 向量之间的相似度来预测新的 ICD 码。我们的模型在广泛的计算实验中证明了其有效性。在公共 MIMIC-III 数据集和私有湘雅数据集上,我们的模型在微 F1(0.583 和 0.806)、微 AUC(0.986 和 0.994)、P@8(0.756 和 0.413)上均取得了最佳性能,且 GPU 内存消耗小得多(约为具有标签注意力机制的模型的 26.1%)。此外,我们验证了我们的模型在预测新 ICD 码方面的能力。可解释性分析和案例研究表明了伪标签注意力机制获得的模式的有效性和可靠性。

相似文献

1
A Pseudo Label-Wise Attention Network for Automatic ICD Coding.基于伪标签注意力网络的 ICD 自动编码方法。
IEEE J Biomed Health Inform. 2022 Oct;26(10):5201-5212. doi: 10.1109/JBHI.2022.3193291. Epub 2022 Oct 5.
2
Hierarchical label-wise attention transformer model for explainable ICD coding.基于分层标签注意力转换器模型的可解释 ICD 编码。
J Biomed Inform. 2022 Sep;133:104161. doi: 10.1016/j.jbi.2022.104161. Epub 2022 Aug 20.
3
Explainable automated coding of clinical notes using hierarchical label-wise attention networks and label embedding initialisation.使用分层标签分类注意力网络和标签嵌入初始化来实现临床笔记的可解释自动化编码。
J Biomed Inform. 2021 Apr;116:103728. doi: 10.1016/j.jbi.2021.103728. Epub 2021 Mar 9.
4
Hyperbolic graph convolutional neural network with contrastive learning for automated ICD coding.基于对比学习的双曲图卷积神经网络在自动化 ICD 编码中的应用。
Comput Biol Med. 2024 Jan;168:107797. doi: 10.1016/j.compbiomed.2023.107797. Epub 2023 Dec 1.
5
JAN: Joint Attention Networks for Automatic ICD Coding.JAN:用于自动 ICD 编码的联合注意网络。
IEEE J Biomed Health Inform. 2022 Oct;26(10):5235-5246. doi: 10.1109/JBHI.2022.3189404. Epub 2022 Oct 4.
6
An explainable CNN approach for medical codes prediction from clinical text.一种用于从临床文本预测医疗编码的可解释 CNN 方法。
BMC Med Inform Decis Mak. 2021 Nov 16;21(Suppl 9):256. doi: 10.1186/s12911-021-01615-6.
7
Multigranularity Label Prediction Model for Automatic International Classification of Diseases Coding in Clinical Text.多粒度标签预测模型在临床文本自动国际疾病分类编码中的应用
J Comput Biol. 2023 Aug;30(8):900-911. doi: 10.1089/cmb.2023.0096. Epub 2023 Jul 31.
8
EHR coding with hybrid attention and features propagation on disease knowledge graph.基于疾病知识图谱的混合注意力与特征传播的电子病历编码。
Artif Intell Med. 2024 Aug;154:102916. doi: 10.1016/j.artmed.2024.102916. Epub 2024 Jun 18.
9
Enhanced ICD-10 code assignment of clinical texts: A summarization-based approach.增强临床文本的 ICD-10 编码分配:基于总结的方法。
Artif Intell Med. 2024 Oct;156:102967. doi: 10.1016/j.artmed.2024.102967. Epub 2024 Aug 20.
10
An empirical evaluation of supervised learning approaches in assigning diagnosis codes to electronic medical records.对监督学习方法在为电子病历分配诊断代码中的实证评估。
Artif Intell Med. 2015 Oct;65(2):155-66. doi: 10.1016/j.artmed.2015.04.007. Epub 2015 May 15.

引用本文的文献

1
Evaluating a Natural Language Processing-Driven, AI-Assisted International Classification of Diseases, 10th Revision, Clinical Modification, Coding System for Diagnosis Related Groups in a Real Hospital Environment: Algorithm Development and Validation Study.在真实医院环境中评估自然语言处理驱动、人工智能辅助的国际疾病分类第 10 版临床修订版、诊断相关组编码系统:算法开发和验证研究。
J Med Internet Res. 2024 Sep 20;26:e58278. doi: 10.2196/58278.