Suppr超能文献

N-gram 支持向量机在可扩展过程和诊断分类中的应用,应用于重症监护病房的临床自由文本数据。

N-gram support vector machines for scalable procedure and diagnosis classification, with applications to clinical free text data from the intensive care unit.

机构信息

Philip R. Lee Institute for Health Policy Studies, School of Medicine, University of California, San Francisco, California, USA.

Philip R. Lee Institute for Health Policy Studies, School of Medicine, University of California, San Francisco, California, USA Department of Neurosurgery, University of California, San Francisco, California, USA.

出版信息

J Am Med Inform Assoc. 2014 Sep-Oct;21(5):871-5. doi: 10.1136/amiajnl-2014-002694. Epub 2014 Apr 30.

Abstract

BACKGROUND

Existing risk adjustment models for intensive care unit (ICU) outcomes rely on manual abstraction of patient-level predictors from medical charts. Developing an automated method for abstracting these data from free text might reduce cost and data collection times.

OBJECTIVE

To develop a support vector machine (SVM) classifier capable of identifying a range of procedures and diagnoses in ICU clinical notes for use in risk adjustment.

MATERIALS AND METHODS

We selected notes from 2001-2008 for 4191 neonatal ICU (NICU) and 2198 adult ICU patients from the MIMIC-II database from the Beth Israel Deaconess Medical Center. Using these notes, we developed an implementation of the SVM classifier to identify procedures (mechanical ventilation and phototherapy in NICU notes) and diagnoses (jaundice in NICU and intracranial hemorrhage (ICH) in adult ICU). On the jaundice classification task, we also compared classifier performance using n-gram features to unigrams with application of a negation algorithm (NegEx).

RESULTS

Our classifier accurately identified mechanical ventilation (accuracy=0.982, F1=0.954) and phototherapy use (accuracy=0.940, F1=0.912), as well as jaundice (accuracy=0.898, F1=0.884) and ICH diagnoses (accuracy=0.938, F1=0.943). Including bigram features improved performance on the jaundice (accuracy=0.898 vs 0.865) and ICH (0.938 vs 0.927) tasks, and outperformed NegEx-derived unigram features (accuracy=0.898 vs 0.863) on the jaundice task.

DISCUSSION

Overall, a classifier using n-gram support vectors displayed excellent performance characteristics. The classifier generalizes to diverse patient populations, diagnoses, and procedures.

CONCLUSIONS

SVM-based classifiers can accurately identify procedure status and diagnoses among ICU patients, and including n-gram features improves performance, compared to existing methods.

摘要

背景

现有的重症监护病房(ICU)结局风险调整模型依赖于从病历中手动提取患者水平预测因子。开发一种从自由文本中提取这些数据的自动化方法可能会降低成本和数据收集时间。

目的

开发一种支持向量机(SVM)分类器,能够识别 ICU 临床记录中的一系列程序和诊断,用于风险调整。

材料和方法

我们从 Beth Israel Deaconess Medical Center 的 MIMIC-II 数据库中选择了 2001 年至 2008 年期间 4191 例新生儿 ICU(NICU)和 2198 例成人 ICU 患者的记录。使用这些记录,我们开发了 SVM 分类器的实现,以识别程序(NICU 记录中的机械通气和光疗)和诊断(NICU 中的黄疸和成人 ICU 中的颅内出血(ICH))。在黄疸分类任务中,我们还比较了使用 n 元特征和否定算法(NegEx)应用的一元特征的分类器性能。

结果

我们的分类器准确地识别了机械通气(准确性=0.982,F1=0.954)和光疗使用(准确性=0.940,F1=0.912),以及黄疸(准确性=0.898,F1=0.884)和 ICH 诊断(准确性=0.938,F1=0.943)。包括二元特征提高了黄疸(准确性=0.898 与 0.865)和 ICH(准确性=0.938 与 0.927)任务的性能,并且在黄疸任务中优于 NegEx 衍生的一元特征(准确性=0.898 与 0.863)。

讨论

总体而言,使用 n 元支持向量的分类器表现出优异的性能特征。该分类器可以推广到不同的患者人群、诊断和程序。

结论

基于 SVM 的分类器可以准确识别 ICU 患者的程序状态和诊断,与现有方法相比,包括 n 元特征可以提高性能。

相似文献

9
Learning regular expressions for clinical text classification.学习正则表达式进行临床文本分类。
J Am Med Inform Assoc. 2014 Sep-Oct;21(5):850-7. doi: 10.1136/amiajnl-2013-002411. Epub 2014 Feb 27.
10
Automatic figure classification in bioscience literature.生物科学文献中的自动图像分类。
J Biomed Inform. 2011 Oct;44(5):848-58. doi: 10.1016/j.jbi.2011.05.003. Epub 2011 May 27.

引用本文的文献

8
Applications of machine learning in acute care research.机器学习在急性护理研究中的应用。
J Am Coll Emerg Physicians Open. 2020 Jul 2;1(5):766-772. doi: 10.1002/emp2.12156. eCollection 2020 Oct.

本文引用的文献

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验