• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用管道来提高去识别性能。

Using a pipeline to improve de-identification performance.

作者信息

Morrison Frances P, Sengupta Soumitra, Hripcsak George

机构信息

Columbia University Department of Biomedical Informatics.

出版信息

AMIA Annu Symp Proc. 2009 Nov 14;2009:447-51.

PMID:20351897
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2815438/
Abstract

Effective de-identification methods are needed to support reuse of electronic health record data for research and other purposes. We investigated using two different text-processing systems in tandem as a strategy for de-identification of clinical notes. We ran 100 outpatient notes through deid.pl, from MIT's PhysioToolkit, followed by MedLEE, and we manually compared the output with original notes to determine the amount of protected health information (PHI) retained. Pipelining resulted in an overall error rate of 2%, with 2 personal names retained in output: one initial and a commonly used English term used in medicine. All retained PHI was transformed into standardized medical concepts, making re-identification less likely. Pipelining using deid.pl improved performance of MedLEE in excluding PHI from output and may be a useful strategy for de-identifying clinical data while providing computer-readable output.

摘要

需要有效的去识别方法来支持电子健康记录数据用于研究和其他目的的再利用。我们研究了串联使用两种不同的文本处理系统作为临床记录去识别的一种策略。我们将100份门诊记录通过麻省理工学院生理工具包的deid.pl,然后再通过MedLEE,并且我们手动将输出结果与原始记录进行比较,以确定保留的受保护健康信息(PHI)的数量。流水线操作导致总体错误率为2%,输出结果中保留了2个个人姓名:一个名字首字母和一个医学中常用的英语术语。所有保留的PHI都被转化为标准化医学概念,降低了重新识别的可能性。使用deid.pl的流水线操作提高了MedLEE从输出中排除PHI的性能,并且在提供计算机可读输出的同时,可能是一种用于临床数据去识别的有用策略。

相似文献

1
Using a pipeline to improve de-identification performance.使用管道来提高去识别性能。
AMIA Annu Symp Proc. 2009 Nov 14;2009:447-51.
2
Repurposing the clinical record: can an existing natural language processing system de-identify clinical notes?重新利用临床记录:现有的自然语言处理系统能否对临床笔记进行去识别化处理?
J Am Med Inform Assoc. 2009 Jan-Feb;16(1):37-9. doi: 10.1197/jamia.M2862. Epub 2008 Oct 24.
3
Automated de-identification of free-text medical records.自由文本医疗记录的自动去识别化
BMC Med Inform Decis Mak. 2008 Jul 24;8:32. doi: 10.1186/1472-6947-8-32.
4
Evaluation of PHI Hunter in Natural Language Processing Research.PHI Hunter在自然语言处理研究中的评估
Perspect Health Inf Manag. 2015 Jan 1;12(Winter):1f. eCollection 2015.
5
A cascaded approach for Chinese clinical text de-identification with less annotation effort.一种用于中文临床文本去识别的级联方法,所需标注工作量较少。
J Biomed Inform. 2017 Sep;73:76-83. doi: 10.1016/j.jbi.2017.07.017. Epub 2017 Jul 26.
6
BoB, a best-of-breed automated text de-identification system for VHA clinical documents.BoB,一种针对 VHA 临床文档的最佳自动文本去识别系统。
J Am Med Inform Assoc. 2013 Jan 1;20(1):77-83. doi: 10.1136/amiajnl-2012-001020. Epub 2012 Sep 4.
7
Improved de-identification of physician notes through integrative modeling of both public and private medical text.通过整合公有和私有医疗文本进行建模,提高医生笔记的去识别化程度。
BMC Med Inform Decis Mak. 2013 Oct 2;13:112. doi: 10.1186/1472-6947-13-112.
8
Text de-identification for privacy protection: a study of its impact on clinical text information content.用于隐私保护的文本去识别化:对其对临床文本信息内容影响的一项研究
J Biomed Inform. 2014 Aug;50:142-50. doi: 10.1016/j.jbi.2014.01.011. Epub 2014 Feb 3.
9
Bootstrapping a de-identification system for narrative patient records: cost-performance tradeoffs.为叙事性患者记录构建去识别系统:成本效益权衡。
Int J Med Inform. 2013 Sep;82(9):821-31. doi: 10.1016/j.ijmedinf.2013.03.005. Epub 2013 Apr 30.
10
Developing a standard for de-identifying electronic patient records written in Swedish: precision, recall and F-measure in a manual and computerized annotation trial.开发一种用于去除瑞典语电子病历中标识符的标准:手动和计算机化注释试验中的精度、召回率和 F 度量。
Int J Med Inform. 2009 Dec;78(12):e19-26. doi: 10.1016/j.ijmedinf.2009.04.005. Epub 2009 May 23.

引用本文的文献

1
Research Goal-Driven Data Model and Harmonization for De-Identifying Patient Data in Radiomics.研究目标驱动的数据模型与放射组学中去识别患者数据的协调
J Digit Imaging. 2021 Aug;34(4):986-1004. doi: 10.1007/s10278-021-00476-9. Epub 2021 Jul 9.
2
Strategies for de-identification and anonymization of electronic health record data for use in multicenter research studies.用于多中心研究的电子健康记录数据去识别和匿名化策略。
Med Care. 2012 Jul;50 Suppl(Suppl):S82-101. doi: 10.1097/MLR.0b013e3182585355.

本文引用的文献

1
Repurposing the clinical record: can an existing natural language processing system de-identify clinical notes?重新利用临床记录:现有的自然语言处理系统能否对临床笔记进行去识别化处理?
J Am Med Inform Assoc. 2009 Jan-Feb;16(1):37-9. doi: 10.1197/jamia.M2862. Epub 2008 Oct 24.
2
Automated de-identification of free-text medical records.自由文本医疗记录的自动去识别化
BMC Med Inform Decis Mak. 2008 Jul 24;8:32. doi: 10.1186/1472-6947-8-32.
3
Rapidly retargetable approaches to de-identification in medical records.医疗记录中快速可重新定位的去识别方法。
J Am Med Inform Assoc. 2007 Sep-Oct;14(5):564-73. doi: 10.1197/jamia.M2435. Epub 2007 Jun 28.
4
Evaluating the state-of-the-art in automatic de-identification.评估自动去识别技术的最新进展。
J Am Med Inform Assoc. 2007 Sep-Oct;14(5):550-63. doi: 10.1197/jamia.M2444. Epub 2007 Jun 28.
5
A secure protocol to distribute unlinkable health data.一种用于分发不可链接健康数据的安全协议。
AMIA Annu Symp Proc. 2005;2005:485-9.
6
Development and evaluation of an open source software tool for deidentification of pathology reports.用于病理报告去识别化的开源软件工具的开发与评估
BMC Med Inform Decis Mak. 2006 Mar 6;6:12. doi: 10.1186/1472-6947-6-12.
7
Evaluation of a deidentification (De-Id) software engine to share pathology reports and clinical documents for research.评估一种用于共享病理学报告和临床文档以进行研究的去识别化(De-Id)软件引擎。
Am J Clin Pathol. 2004 Feb;121(2):176-86. doi: 10.1309/E6K3-3GBP-E5C2-7FYU.
8
Concept-match medical data scrubbing. How pathology text can be used in research.概念匹配医学数据清理。病理学文本如何用于研究。
Arch Pathol Lab Med. 2003 Jun;127(6):680-6. doi: 10.5858/2003-127-680-CMDS.
9
Identification of patient name references within medical documents using semantic selectional restrictions.利用语义选择限制在医学文档中识别患者姓名指代
Proc AMIA Symp. 2002:757-61.
10
Medical document anonymization with a semantic lexicon.使用语义词典对医学文档进行匿名化处理。
Proc AMIA Symp. 2000:729-33.