• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PheNormGPT:一种用于提取和规范关键医学发现的框架。

PheNormGPT: a framework for extraction and normalization of key medical findings.

机构信息

McWilliams School of Biomedical Informatics, University of Texas Health Science Center at Houston, 7000 Fannin St #600, Houston, TX 77030, United States.

出版信息

Database (Oxford). 2024 Oct 23;2024. doi: 10.1093/database/baae103.

DOI:10.1093/database/baae103
PMID:39444329
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11498178/
Abstract

This manuscript presents PheNormGPT, a framework for extraction and normalization of key findings in clinical text. PheNormGPT relies on an innovative approach, leveraging large language models to extract key findings and phenotypic data in unstructured clinical text and map them to Human Phenotype Ontology concepts. It utilizes OpenAI's GPT-3.5 Turbo and GPT-4 models with fine-tuning and few-shot learning strategies, including a novel few-shot learning strategy for custom-tailored few-shot example selection per request. PheNormGPT was evaluated in the BioCreative VIII Track 3: Genetic Phenotype Extraction from Dysmorphology Physical Examination Entries shared task. PheNormGPT achieved an F1 score of 0.82 for standard matching and 0.72 for exact matching, securing first place for this shared task.

摘要

本文提出了 PheNormGPT,这是一个从临床文本中提取和规范化关键发现的框架。PheNormGPT 依赖于一种创新的方法,利用大型语言模型从非结构化的临床文本中提取关键发现和表型数据,并将其映射到人类表型本体概念。它使用 OpenAI 的 GPT-3.5 Turbo 和 GPT-4 模型进行微调,并采用了 few-shot 学习策略,包括一种新的针对每个请求定制的 few-shot 示例选择的 few-shot 学习策略。PheNormGPT 在 BioCreative VIII 第 3 轨道:从发育异常体格检查条目遗传表型提取共享任务中进行了评估。PheNormGPT 在标准匹配方面的 F1 得分为 0.82,在精确匹配方面的 F1 得分为 0.72,在这个共享任务中获得了第一名。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/c16dc8f962db/baae103f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/de6943027b97/baae103f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/0bfeacfd21c6/baae103f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/c918094a9b6d/baae103f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/c16dc8f962db/baae103f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/de6943027b97/baae103f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/0bfeacfd21c6/baae103f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/c918094a9b6d/baae103f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d506/11498178/c16dc8f962db/baae103f4.jpg

相似文献

1
PheNormGPT: a framework for extraction and normalization of key medical findings.PheNormGPT:一种用于提取和规范关键医学发现的框架。
Database (Oxford). 2024 Oct 23;2024. doi: 10.1093/database/baae103.
2
Evaluating the OpenAI's GPT-3.5 Turbo's performance in extracting information from scientific articles on diabetic retinopathy.评估 OpenAI 的 GPT-3.5 Turbo 在从关于糖尿病视网膜病变的科学文章中提取信息的性能。
Syst Rev. 2024 May 16;13(1):135. doi: 10.1186/s13643-024-02523-2.
3
Comparing Commercial and Open-Source Large Language Models for Labeling Chest Radiograph Reports.比较商用和开源大语言模型在标注胸部 X 光报告中的表现。
Radiology. 2024 Oct;313(1):e241139. doi: 10.1148/radiol.241139.
4
Improving large language models for clinical named entity recognition via prompt engineering.通过提示工程改进临床命名实体识别的大型语言模型。
J Am Med Inform Assoc. 2024 Sep 1;31(9):1812-1820. doi: 10.1093/jamia/ocad259.
5
A large language model-based generative natural language processing framework fine-tuned on clinical notes accurately extracts headache frequency from electronic health records.基于大型语言模型的生成式自然语言处理框架,在临床笔记上进行了微调,能够从电子健康记录中准确提取头痛频率。
Headache. 2024 Apr;64(4):400-409. doi: 10.1111/head.14702. Epub 2024 Mar 25.
6
Information extraction from medical case reports using OpenAI InstructGPT.使用 OpenAI InstructGPT 从医学病例报告中提取信息。
Comput Methods Programs Biomed. 2024 Oct;255:108326. doi: 10.1016/j.cmpb.2024.108326. Epub 2024 Jul 18.
7
CACER: Clinical concept Annotations for Cancer Events and Relations.CACER:癌症事件与关系的临床概念注释。
J Am Med Inform Assoc. 2024 Nov 1;31(11):2583-2594. doi: 10.1093/jamia/ocae231.
8
Optimized biomedical entity relation extraction method with data augmentation and classification using GPT-4 and Gemini.基于 GPT-4 和 Gemini 的生物医学实体关系抽取数据增强与分类优化方法
Database (Oxford). 2024 Oct 9;2024. doi: 10.1093/database/baae104.
9
Privacy-ensuring Open-weights Large Language Models Are Competitive with Closed-weights GPT-4o in Extracting Chest Radiography Findings from Free-Text Reports.在从自由文本报告中提取胸部X光检查结果方面,确保隐私的开放权重大型语言模型与封闭权重的GPT-4o具有竞争力。
Radiology. 2025 Jan;314(1):e240895. doi: 10.1148/radiol.240895.
10
An Automatic and End-to-End System for Rare Disease Knowledge Graph Construction Based on Ontology-Enhanced Large Language Models: Development Study.基于本体增强大语言模型的罕见病知识图谱构建自动端到端系统:开发研究
JMIR Med Inform. 2024 Dec 18;12:e60665. doi: 10.2196/60665.

本文引用的文献

1
Benchmarking large language models' performances for myopia care: a comparative analysis of ChatGPT-3.5, ChatGPT-4.0, and Google Bard.比较分析 ChatGPT-3.5、ChatGPT-4.0 和谷歌巴德在近视防控方面的表现:大型语言模型的基准测试。
EBioMedicine. 2023 Sep;95:104770. doi: 10.1016/j.ebiom.2023.104770. Epub 2023 Aug 23.
2
The suitability of UMLS and SNOMED-CT for encoding outcome concepts.UMLS 和 SNOMED-CT 用于编码结局概念的适宜性。
J Am Med Inform Assoc. 2023 Nov 17;30(12):1895-1903. doi: 10.1093/jamia/ocad161.
3
Ten quick tips for harnessing the power of ChatGPT in computational biology.
利用ChatGPT在计算生物学中发挥作用的十条快速提示。
PLoS Comput Biol. 2023 Aug 10;19(8):e1011319. doi: 10.1371/journal.pcbi.1011319. eCollection 2023 Aug.
4
Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language models.ChatGPT在美国医师执照考试中的表现:使用大语言模型进行人工智能辅助医学教育的潜力。
PLOS Digit Health. 2023 Feb 9;2(2):e0000198. doi: 10.1371/journal.pdig.0000198. eCollection 2023 Feb.
5
PhenoBERT: A Combined Deep Learning Method for Automated Recognition of Human Phenotype Ontology.PhenoBERT:一种用于自动识别人类表型本体的深度学习组合方法。
IEEE/ACM Trans Comput Biol Bioinform. 2023 Mar-Apr;20(2):1269-1277. doi: 10.1109/TCBB.2022.3170301. Epub 2023 Apr 3.
6
A clinical trials corpus annotated with UMLS entities to enhance the access to evidence-based medicine.一个用统一医学语言系统(UMLS)实体注释的临床试验语料库,以加强对循证医学的获取。
BMC Med Inform Decis Mak. 2021 Feb 22;21(1):69. doi: 10.1186/s12911-021-01395-z.
7
PhenoTagger: a hybrid method for phenotype concept recognition using human phenotype ontology.PhenoTagger:一种使用人类表型本体进行表型概念识别的混合方法。
Bioinformatics. 2021 Jul 27;37(13):1884-1890. doi: 10.1093/bioinformatics/btab019.
8
CNFE-SE: a novel approach combining complex network-based feature engineering and stacked ensemble to predict the success of intrauterine insemination and ranking the features.CNFE-SE:一种结合基于复杂网络的特征工程和堆叠集成的新方法,用于预测宫腔内人工授精的成功率和对特征进行排序。
BMC Med Inform Decis Mak. 2021 Jan 2;21(1):1. doi: 10.1186/s12911-020-01362-0.
9
The Human Phenotype Ontology in 2021.2021 年人类表型本体论。
Nucleic Acids Res. 2021 Jan 8;49(D1):D1207-D1217. doi: 10.1093/nar/gkaa1043.
10
Leveraging the UMLS As a Data Standard for Rare Disease Data Normalization and Harmonization.利用统一医学语言系统作为罕见病数据标准化和协调的数据标准。
Methods Inf Med. 2020 Aug;59(4-05):131-139. doi: 10.1055/s-0040-1718940. Epub 2020 Nov 4.