Suppr超能文献

PheNormGPT:一种用于提取和规范关键医学发现的框架。

PheNormGPT: a framework for extraction and normalization of key medical findings.

机构信息

McWilliams School of Biomedical Informatics, University of Texas Health Science Center at Houston, 7000 Fannin St #600, Houston, TX 77030, United States.

出版信息

Database (Oxford). 2024 Oct 23;2024. doi: 10.1093/database/baae103.

Abstract

This manuscript presents PheNormGPT, a framework for extraction and normalization of key findings in clinical text. PheNormGPT relies on an innovative approach, leveraging large language models to extract key findings and phenotypic data in unstructured clinical text and map them to Human Phenotype Ontology concepts. It utilizes OpenAI's GPT-3.5 Turbo and GPT-4 models with fine-tuning and few-shot learning strategies, including a novel few-shot learning strategy for custom-tailored few-shot example selection per request. PheNormGPT was evaluated in the BioCreative VIII Track 3: Genetic Phenotype Extraction from Dysmorphology Physical Examination Entries shared task. PheNormGPT achieved an F1 score of 0.82 for standard matching and 0.72 for exact matching, securing first place for this shared task.

摘要

本文提出了 PheNormGPT,这是一个从临床文本中提取和规范化关键发现的框架。PheNormGPT 依赖于一种创新的方法,利用大型语言模型从非结构化的临床文本中提取关键发现和表型数据,并将其映射到人类表型本体概念。它使用 OpenAI 的 GPT-3.5 Turbo 和 GPT-4 模型进行微调,并采用了 few-shot 学习策略,包括一种新的针对每个请求定制的 few-shot 示例选择的 few-shot 学习策略。PheNormGPT 在 BioCreative VIII 第 3 轨道:从发育异常体格检查条目遗传表型提取共享任务中进行了评估。PheNormGPT 在标准匹配方面的 F1 得分为 0.82,在精确匹配方面的 F1 得分为 0.72,在这个共享任务中获得了第一名。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/de6943027b97/baae103f1.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验