• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

对电子健康记录数据库进行去识别处理——医疗记录的匿名性、准确性和可读性。

De-identifying an EHR database - anonymity, correctness and readability of the medical record.

作者信息

Pantazos Kostas, Lauesen Soren, Lippert Soren

机构信息

Software Development Group, IT-University of Copenhagen, Denmark.

出版信息

Stud Health Technol Inform. 2011;169:862-6.

PMID:21893869
Abstract

Electronic health records (EHR) contain a large amount of structured data and free text. Exploring and sharing clinical data can improve healthcare and facilitate the development of medical software. However, revealing confidential information is against ethical principles and laws. We de-identified a Danish EHR database with 437,164 patients. The goal was to generate a version with real medical records, but related to artificial persons. We developed a de-identification algorithm that uses lists of named entities, simple language analysis, and special rules. Our algorithm consists of 3 steps: collect lists of identifiers from the database and external resources, define a replacement for each identifier, and replace identifiers in structured data and free text. Some patient records could not be safely de-identified, so the de-identified database has 323,122 patient records with an acceptable degree of anonymity, readability and correctness (F-measure of 95%). The algorithm has to be adjusted for each culture, language and database.

摘要

电子健康记录(EHR)包含大量结构化数据和自由文本。探索和共享临床数据可以改善医疗保健并促进医疗软件的开发。然而,泄露机密信息违反伦理原则和法律。我们对一个拥有437,164名患者的丹麦EHR数据库进行了去识别处理。目标是生成一个包含真实医疗记录但与虚构人物相关的版本。我们开发了一种去识别算法,该算法使用命名实体列表、简单语言分析和特殊规则。我们的算法包括3个步骤:从数据库和外部资源收集标识符列表,为每个标识符定义替换项,以及替换结构化数据和自由文本中的标识符。一些患者记录无法安全地进行去识别处理,因此去识别后的数据库有323,122条患者记录,具有可接受的匿名程度、可读性和正确性(F值为95%)。该算法必须针对每种文化、语言和数据库进行调整。

相似文献

1
De-identifying an EHR database - anonymity, correctness and readability of the medical record.对电子健康记录数据库进行去识别处理——医疗记录的匿名性、准确性和可读性。
Stud Health Technol Inform. 2011;169:862-6.
2
The MITRE Identification Scrubber Toolkit: design, training, and assessment.MITRE 识别清理工具包:设计、培训和评估。
Int J Med Inform. 2010 Dec;79(12):849-59. doi: 10.1016/j.ijmedinf.2010.09.007. Epub 2010 Oct 14.
3
De-identification of primary care electronic medical records free-text data in Ontario, Canada.加拿大安大略省初级保健电子病历自由文本数据的去识别化。
BMC Med Inform Decis Mak. 2010 Jun 18;10:35. doi: 10.1186/1472-6947-10-35.
4
Risk assessment of integrated electronic health records.整合电子健康记录的风险评估
Stud Health Technol Inform. 2010;155:78-84.
5
A computational model to protect patient data from location-based re-identification.一种用于保护患者数据免遭基于位置的重新识别的计算模型。
Artif Intell Med. 2007 Jul;40(3):223-39. doi: 10.1016/j.artmed.2007.04.002. Epub 2007 Jun 1.
6
Issues in identification and linkage of patient records across an integrated delivery system.综合医疗服务体系中患者记录的识别与关联问题。
J Healthc Inf Manag. 1998 Fall;12(3):43-52.
7
Preserving medical correctness, readability and consistency in de-identified health records.保留去识别健康记录中的医学准确性、可读性和一致性。
Health Informatics J. 2017 Dec;23(4):291-303. doi: 10.1177/1460458216647760. Epub 2016 May 19.
8
Securing electronic health records without impeding the flow of information.在不阻碍信息流通的情况下保护电子健康记录。
Int J Med Inform. 2007 May-Jun;76(5-6):471-9. doi: 10.1016/j.ijmedinf.2006.09.015. Epub 2007 Jan 3.
9
Proposal and evaluation of FASDIM, a Fast And Simple De-Identification Method for unstructured free-text clinical records.提出并评估了 FASDIM,一种用于非结构化自由文本临床记录的快速简便去识别方法。
Int J Med Inform. 2014 Apr;83(4):303-12. doi: 10.1016/j.ijmedinf.2013.11.005. Epub 2013 Dec 7.
10
Secure construction of k-unlinkable patient records from distributed providers.从分布式提供者那里构建 k 不可链接的患者记录的安全性。
Artif Intell Med. 2010 Jan;48(1):29-41. doi: 10.1016/j.artmed.2009.09.002. Epub 2009 Oct 28.

引用本文的文献

1
A scoping review of preprocessing methods for unstructured text data to assess data quality.对非结构化文本数据进行预处理以评估数据质量的范围回顾。
Int J Popul Data Sci. 2022 Oct 4;7(1):1757. doi: 10.23889/ijpds.v6i1.1757. eCollection 2022.
2
The Potential of Research Drawing on Clinical Free Text to Bring Benefits to Patients in the United Kingdom: A Systematic Review of the Literature.利用临床自由文本进行研究为英国患者带来益处的潜力:文献系统综述
Front Digit Health. 2021 Feb 10;3:606599. doi: 10.3389/fdgth.2021.606599. eCollection 2021.
3
"Big data" and the electronic health record.
“大数据”与电子健康记录
Yearb Med Inform. 2014 Aug 15;9(1):97-104. doi: 10.15265/IY-2014-0003.