• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

临床问题清单条目在基于神经网络的疾病代码分配中的二次使用。

Secondary Use of Clinical Problem List Entries for Neural Network-Based Disease Code Assignment.

机构信息

Institute for Medical Informatics, Statistics and Documentation, Medical University of Graz, Austria.

Department of Information and Process Management, Steiermärkische Krankenanstaltengesellschaft m.b.H. (KAGes), Graz, Austria.

出版信息

Stud Health Technol Inform. 2023 May 18;302:788-792. doi: 10.3233/SHTI230267.

DOI:10.3233/SHTI230267
PMID:37203496
Abstract

Clinical information systems have become large repositories for semi-structured and partly annotated electronic health record data, which have reached a critical mass that makes them interesting for supervised data-driven neural network approaches. We explored automated coding of 50 character long clinical problem list entries using the International Classification of Diseases (ICD-10) and evaluated three different types of network architectures on the top 100 ICD-10 three-digit codes. A fastText baseline reached a macro-averaged F1-score of 0.83, followed by a character-level LSTM with a macro-averaged F1-score of 0.84. The top performing approach used a downstreamed RoBERTa model with a custom language model, yielding a macro-averaged F1-score of 0.88. A neural network activation analysis together with an investigation of the false positives and false negatives unveiled inconsistent manual coding as a main limiting factor.

摘要

临床信息系统已经成为半结构化和部分注释的电子健康记录数据的大型存储库,这些数据已经达到了一个关键数量,使得它们对于有监督的数据驱动的神经网络方法很有意义。我们探索了使用国际疾病分类(ICD-10)对 50 个字符长的临床问题列表条目的自动编码,并在 100 个 ICD-10 三位数代码上评估了三种不同类型的网络架构。FastText 基线达到了 0.83 的宏平均 F1 分数,其次是字符级别的 LSTM,其宏平均 F1 分数为 0.84。表现最好的方法是使用带有自定义语言模型的下游 RoBERTa 模型,其宏平均 F1 分数为 0.88。神经网络激活分析以及对假阳性和假阴性的研究揭示了不一致的手动编码是一个主要的限制因素。

相似文献

1
Secondary Use of Clinical Problem List Entries for Neural Network-Based Disease Code Assignment.临床问题清单条目在基于神经网络的疾病代码分配中的二次使用。
Stud Health Technol Inform. 2023 May 18;302:788-792. doi: 10.3233/SHTI230267.
2
Supervised Text Classification System Detects Fontan Patients in Electronic Records With Higher Accuracy Than Codes.监督式文本分类系统在电子病历中的 Fontan 患者检测准确率高于编码。
J Am Heart Assoc. 2023 Jul 4;12(13):e030046. doi: 10.1161/JAHA.123.030046. Epub 2023 Jun 22.
3
Automated ICD coding via unsupervised knowledge integration (UNITE).基于无监督知识集成的 ICD 编码自动化(UNITE)。
Int J Med Inform. 2020 Jul;139:104135. doi: 10.1016/j.ijmedinf.2020.104135. Epub 2020 Apr 4.
4
Classifying social determinants of health from unstructured electronic health records using deep learning-based natural language processing.利用基于深度学习的自然语言处理技术从非结构化电子健康记录中分类社会健康决定因素。
J Biomed Inform. 2022 Mar;127:103984. doi: 10.1016/j.jbi.2021.103984. Epub 2022 Jan 7.
5
Medical code prediction via capsule networks and ICD knowledge.基于胶囊网络和 ICD 知识的医疗编码预测。
BMC Med Inform Decis Mak. 2021 Jul 30;21(Suppl 2):55. doi: 10.1186/s12911-021-01426-9.
6
Clinical Relation Extraction Toward Drug Safety Surveillance Using Electronic Health Record Narratives: Classical Learning Versus Deep Learning.利用电子健康记录叙述进行药物安全监测的临床关系提取:经典学习与深度学习
JMIR Public Health Surveill. 2018 Apr 25;4(2):e29. doi: 10.2196/publichealth.9361.
7
Creating a computer assisted ICD coding system: Performance metric choice and use of the ICD hierarchy.创建计算机辅助 ICD 编码系统:性能指标的选择和 ICD 层次结构的使用。
J Biomed Inform. 2024 Apr;152:104617. doi: 10.1016/j.jbi.2024.104617. Epub 2024 Mar 1.
8
An empirical evaluation of deep learning for ICD-9 code assignment using MIMIC-III clinical notes.基于 MIMIC-III 临床记录的深度学习方法在 ICD-9 编码任务中的实证评估
Comput Methods Programs Biomed. 2019 Aug;177:141-153. doi: 10.1016/j.cmpb.2019.05.024. Epub 2019 May 25.
9
Automating the assignment of diagnosis codes to patient encounters using example-based and machine learning techniques.使用基于示例和机器学习技术实现患者就诊诊断代码分配的自动化。
J Am Med Inform Assoc. 2006 Sep-Oct;13(5):516-25. doi: 10.1197/jamia.M2077. Epub 2006 Jun 23.
10
Cohort selection for clinical trials using hierarchical neural network.使用分层神经网络进行临床试验的队列选择。
J Am Med Inform Assoc. 2019 Nov 1;26(11):1203-1208. doi: 10.1093/jamia/ocz099.

引用本文的文献

1
Autonomous International Classification of Diseases Coding Using Pretrained Language Models and Advanced Prompt Learning Techniques: Evaluation of an Automated Analysis System Using Medical Text.使用预训练语言模型和先进提示学习技术的自主国际疾病分类编码:对一个使用医学文本的自动分析系统的评估
JMIR Med Inform. 2025 Jan 6;13:e63020. doi: 10.2196/63020.