• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

台湾混合电子健康记录中受保护健康信息的识别。

Protected Health Information Recognition of Unstructured Code-Mixed Electronic Health Records in Taiwan.

机构信息

Intelligent System Lab, College of Electrical Engineering and Computer Science, Department of Electrical Engineering, National Kaohsiung University Science and Technology, Kaohsiung, Taiwan R.O.C.

Department of Psychiatry, National Taiwan University Hospital, Taipei, Taiwan R.O.C.

出版信息

Stud Health Technol Inform. 2022 Jun 6;290:627-631. doi: 10.3233/SHTI220153.

DOI:10.3233/SHTI220153
PMID:35673092
Abstract

Electronic health records (EHRs) at medical institutions provide valuable sources for research in both clinical and biomedical domains. However, before such records can be used for research purposes, protected health information (PHI) mentioned in the unstructured text must be removed. In Taiwan's EHR systems the unstructured EHR texts are usually represented in the mixing of English and Chinese languages, which brings challenges for de-identification. This paper presented the first study, to the best of our knowledge, of the construction of a code-mixed EHR de-identification corpus and the evaluation of different mature entity recognition methods applied for the code-mixed PHI recognition task.

摘要

医疗机构的电子健康记录 (EHR) 为临床和生物医学领域的研究提供了有价值的资源。然而,在将这些记录用于研究目的之前,必须删除非结构化文本中提到的受保护健康信息 (PHI)。在台湾的 EHR 系统中,非结构化的 EHR 文本通常是英文和中文混合表示的,这给去识别带来了挑战。本文首次构建了一个代码混合 EHR 去识别语料库,并评估了不同成熟的实体识别方法在代码混合 PHI 识别任务中的应用,据我们所知,这是该领域的首次研究。

相似文献

1
Protected Health Information Recognition of Unstructured Code-Mixed Electronic Health Records in Taiwan.台湾混合电子健康记录中受保护健康信息的识别。
Stud Health Technol Inform. 2022 Jun 6;290:627-631. doi: 10.3233/SHTI220153.
2
Unlocking the Secrets Behind Advanced Artificial Intelligence Language Models in Deidentifying Chinese-English Mixed Clinical Text: Development and Validation Study.揭开高级人工智能语言模型在去识别汉英混合临床文本背后的秘密:开发与验证研究。
J Med Internet Res. 2024 Jan 25;26:e48443. doi: 10.2196/48443.
3
Evaluation of PHI Hunter in Natural Language Processing Research.PHI Hunter在自然语言处理研究中的评估
Perspect Health Inf Manag. 2015 Jan 1;12(Winter):1f. eCollection 2015.
4
A machine learning based approach to identify protected health information in Chinese clinical text.基于机器学习的方法识别中文临床文本中的保护健康信息。
Int J Med Inform. 2018 Aug;116:24-32. doi: 10.1016/j.ijmedinf.2018.05.010. Epub 2018 May 22.
5
Proposal and evaluation of FASDIM, a Fast And Simple De-Identification Method for unstructured free-text clinical records.提出并评估了 FASDIM,一种用于非结构化自由文本临床记录的快速简便去识别方法。
Int J Med Inform. 2014 Apr;83(4):303-12. doi: 10.1016/j.ijmedinf.2013.11.005. Epub 2013 Dec 7.
6
A study of deep learning methods for de-identification of clinical notes in cross-institute settings.深度学习方法在跨机构环境下对临床记录进行去识别的研究。
BMC Med Inform Decis Mak. 2019 Dec 5;19(Suppl 5):232. doi: 10.1186/s12911-019-0935-4.
7
De-identification of clinical free text using natural language processing: A systematic review of current approaches.使用自然语言处理对临床自由文本进行去识别化:当前方法的系统评价。
Artif Intell Med. 2024 May;151:102845. doi: 10.1016/j.artmed.2024.102845. Epub 2024 Mar 20.
8
OpenDeID Pipeline for Unstructured Electronic Health Record Text Notes Based on Rules and Transformers: Deidentification Algorithm Development and Validation Study.基于规则和转换器的非结构化电子健康记录文本注释的 OpenDeID 管道:去识别算法的开发和验证研究。
J Med Internet Res. 2023 Dec 6;25:e48145. doi: 10.2196/48145.
9
Automatic de-identification of French electronic health records: a cost-effective approach exploiting distant supervision and deep learning models.自动去除法国电子健康记录中的标识符:一种利用远程监督和深度学习模型的具有成本效益的方法。
BMC Med Inform Decis Mak. 2024 Feb 16;24(1):54. doi: 10.1186/s12911-024-02422-5.
10
Combining knowledge- and data-driven methods for de-identification of clinical narratives.结合知识驱动和数据驱动方法对临床记录进行去识别化处理。
J Biomed Inform. 2015 Dec;58 Suppl(Suppl):S53-S59. doi: 10.1016/j.jbi.2015.06.029. Epub 2015 Jul 22.

引用本文的文献

1
Unlocking the Secrets Behind Advanced Artificial Intelligence Language Models in Deidentifying Chinese-English Mixed Clinical Text: Development and Validation Study.揭开高级人工智能语言模型在去识别汉英混合临床文本背后的秘密:开发与验证研究。
J Med Internet Res. 2024 Jan 25;26:e48443. doi: 10.2196/48443.