• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
Extracting Concepts for Precision Oncology from the Biomedical Literature.从生物医学文献中提取精准肿瘤学概念。
AMIA Jt Summits Transl Sci Proc. 2021 May 17;2021:276-285. eCollection 2021.
2
Ensembles of natural language processing systems for portable phenotyping solutions.用于便携表型解决方案的自然语言处理系统集合。
J Biomed Inform. 2019 Dec;100:103318. doi: 10.1016/j.jbi.2019.103318. Epub 2019 Oct 23.
3
Natural language processing (NLP) tools in extracting biomedical concepts from research articles: a case study on autism spectrum disorder.自然语言处理(NLP)工具在从研究文章中提取生物医学概念中的应用:以自闭症谱系障碍为例。
BMC Med Inform Decis Mak. 2020 Dec 30;20(Suppl 11):322. doi: 10.1186/s12911-020-01352-2.
4
Extracting comprehensive clinical information for breast cancer using deep learning methods.利用深度学习方法提取乳腺癌全面临床信息。
Int J Med Inform. 2019 Dec;132:103985. doi: 10.1016/j.ijmedinf.2019.103985. Epub 2019 Oct 2.
5
A comparison of word embeddings for the biomedical natural language processing.生物医学自然语言处理中词嵌入的比较。
J Biomed Inform. 2018 Nov;87:12-20. doi: 10.1016/j.jbi.2018.09.008. Epub 2018 Sep 12.
6
Automatic data extraction to support meta-analysis statistical analysis: a case study on breast cancer.自动数据提取以支持荟萃分析统计分析:以乳腺癌为例。
BMC Med Inform Decis Mak. 2022 Jun 18;22(1):158. doi: 10.1186/s12911-022-01897-4.
7
Automatic categorization of self-acknowledged limitations in randomized controlled trial publications.自我承认的随机对照试验出版物局限性的自动分类。
J Biomed Inform. 2024 Apr;152:104628. doi: 10.1016/j.jbi.2024.104628. Epub 2024 Mar 26.
8
Assessing citation integrity in biomedical publications: corpus annotation and NLP models.评估生物医学出版物的引文完整性:语料库标注和自然语言处理模型。
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae420.
9
Automatically Detecting Failures in Natural Language Processing Tools for Online Community Text.自动检测在线社区文本自然语言处理工具中的故障。
J Med Internet Res. 2015 Aug 31;17(8):e212. doi: 10.2196/jmir.4612.
10
BioCreative VI Precision Medicine Track system performance is constrained by entity recognition and variations in corpus characteristics.生物创意 VI 精准医疗轨道系统的性能受到实体识别和语料库特征变化的限制。
Database (Oxford). 2018 Jan 1;2018:bay122. doi: 10.1093/database/bay122.

引用本文的文献

1
Proliferation and Apoptosis Pathways and Factors in Oral Squamous Cell Carcinoma.口腔鳞状细胞癌中的增殖和凋亡途径及相关因素。
Int J Mol Sci. 2022 Jan 29;23(3):1562. doi: 10.3390/ijms23031562.

本文引用的文献

1
Overview of the TREC 2019 Precision Medicine Track.2019年精准医学专题的概述。
Text Retr Conf. 2019 Nov;1250.
2
Overview of the TREC 2017 Precision Medicine Track.2017年精准医学专题的概述。
Text Retr Conf. 2017 Nov;26.
3
Developing a Search Engine for Precision Medicine.开发用于精准医学的搜索引擎。
AMIA Jt Summits Transl Sci Proc. 2020 May 30;2020:579-588. eCollection 2020.
4
BERT-based Ranking for Biomedical Entity Normalization.基于BERT的生物医学实体规范化排序
AMIA Jt Summits Transl Sci Proc. 2020 May 30;2020:269-277. eCollection 2020.
5
PGxCorpus, a manually annotated corpus for pharmacogenomics.PGxCorpus,一个用于药物基因组学的人工标注语料库。
Sci Data. 2020 Jan 2;7(1):3. doi: 10.1038/s41597-019-0342-9.
6
Natural language processing to facilitate breast cancer research and management.自然语言处理促进乳腺癌研究和管理。
Breast J. 2020 Jan;26(1):92-99. doi: 10.1111/tbj.13718. Epub 2019 Dec 18.
7
A frame semantic overview of NLP-based information extraction for cancer-related EHR notes.基于框架语义的自然语言处理信息抽取在癌症相关电子病历中的应用综述。
J Biomed Inform. 2019 Dec;100:103301. doi: 10.1016/j.jbi.2019.103301. Epub 2019 Oct 4.
8
Using Machine Learning and Natural Language Processing to Review and Classify the Medical Literature on Cancer Susceptibility Genes.使用机器学习和自然语言处理技术对癌症易感基因的医学文献进行综述和分类。
JCO Clin Cancer Inform. 2019 Sep;3:1-9. doi: 10.1200/CCI.19.00042.
9
BioBERT: a pre-trained biomedical language representation model for biomedical text mining.BioBERT:一种用于生物医学文本挖掘的预训练生物医学语言表示模型。
Bioinformatics. 2020 Feb 15;36(4):1234-1240. doi: 10.1093/bioinformatics/btz682.
10
Validation of a Semiautomated Natural Language Processing-Based Procedure for Meta-Analysis of Cancer Susceptibility Gene Penetrance.基于半自动化自然语言处理的癌症易感性基因外显率荟萃分析程序的验证
JCO Clin Cancer Inform. 2019 Aug;3:1-9. doi: 10.1200/CCI.19.00043.

从生物医学文献中提取精准肿瘤学概念。

Extracting Concepts for Precision Oncology from the Biomedical Literature.

机构信息

Department of Computer Science, Columbia University New York City NY, USA.

School of Biomedical Informatics, The University of Texas Health Science Center at Houston Houston TX, USA.

出版信息

AMIA Jt Summits Transl Sci Proc. 2021 May 17;2021:276-285. eCollection 2021.

PMID:34457142
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8378653/
Abstract

This paper describes an initial dataset and automatic natural language processing (NLP) method for extracting concepts related to precision oncology from biomedical research articles. We extract five concept types: Cancer, Mutation, Population, Treatment, Outcome. A corpus of 250 biomedical abstracts were annotated with these concepts following standard double-annotation procedures. We then experiment with BERT-based models for concept extraction. The best-performing model achieved a precision of 63.8%, a recall of 71.9%, and an F1 of 67.1. Finally, we propose additional directions for research for improving extraction performance and utilizing the NLP system in downstream precision oncology applications.

摘要

本文描述了一个初始数据集和一种自动自然语言处理 (NLP) 方法,用于从生物医学研究文章中提取与精准肿瘤学相关的概念。我们提取了五个概念类型:癌症、突变、人群、治疗、结果。遵循标准的双重注释程序,对 250 篇生物医学摘要进行了这些概念的注释。然后,我们尝试使用基于 BERT 的模型进行概念提取。表现最好的模型的精度为 63.8%,召回率为 71.9%,F1 值为 67.1%。最后,我们提出了进一步的研究方向,以提高提取性能,并在下游精准肿瘤学应用中利用 NLP 系统。