• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

挖掘医学在线数据库(MEDLINE):摘要、句子还是短语?

Mining MEDLINE: abstracts, sentences, or phrases?

作者信息

Ding J, Berleant D, Nettleton D, Wurtele E

机构信息

Department of Electrical and Computer Engineering, Iowa State University, Ames, Iowa 50011, USA.

出版信息

Pac Symp Biocomput. 2002:326-37. doi: 10.1142/9789812799623_0031.

DOI:10.1142/9789812799623_0031
PMID:11928487
Abstract

A growing body of works address automated mining of biochemical knowledge from digital repositories of scientific literature, such as MEDLINE. Some of these works use abstracts as the unit of text from which to extract facts. Others use sentences for this purpose, while still others use phrases. Here we compare abstracts, sentences, and phrases in MEDLINE using the standard information retrieval performance measures of recall, precision, and effectiveness, for the task of mining interactions among biochemical terms based on term co-occurrence. Results show statistically significant differences that can impact the choice of text unit.

摘要

越来越多的研究致力于从诸如MEDLINE之类的科学文献数字存储库中自动挖掘生化知识。其中一些研究将摘要作为提取事实的文本单元。另一些研究则为此目的使用句子,还有一些研究使用短语。在此,我们基于词共现任务,使用召回率、精确率和有效性等标准信息检索性能指标,比较MEDLINE中的摘要、句子和短语,以挖掘生化术语之间的相互作用。结果显示出具有统计学意义的差异,这些差异可能会影响文本单元的选择。

相似文献

1
Mining MEDLINE: abstracts, sentences, or phrases?挖掘医学在线数据库(MEDLINE):摘要、句子还是短语?
Pac Symp Biocomput. 2002:326-37. doi: 10.1142/9789812799623_0031.
2
Information content in Medline record fields.医学在线数据库(Medline)记录字段中的信息内容。
Int J Med Inform. 2004 Jun 30;73(6):515-27. doi: 10.1016/j.ijmedinf.2004.02.008.
3
Extracting Characteristics of the Study Subjects from Full-Text Articles.从全文文章中提取研究对象的特征。
AMIA Annu Symp Proc. 2015 Nov 5;2015:484-91. eCollection 2015.
4
A comparison of retrieval effectiveness for three methods of indexing medical literature.三种医学文献索引方法的检索效果比较。
Am J Med Sci. 1992 May;303(5):292-300. doi: 10.1097/00000441-199205000-00004.
5
Using argumentation to extract key sentences from biomedical abstracts.利用论证从生物医学摘要中提取关键句子。
Int J Med Inform. 2007 Feb-Mar;76(2-3):195-200. doi: 10.1016/j.ijmedinf.2006.05.002. Epub 2006 Jul 11.
6
Preliminary assessment of the effect of more informative (structured) abstracts on citation retrieval from MEDLINE.对信息量更大(结构化)摘要对从医学文献数据库(MEDLINE)中检索引用文献的效果的初步评估。
Medinfo. 1995;8 Pt 2:1457-61.
7
Evaluation of SAPHIRE: an automated approach to indexing and retrieving medical literature.对蓝宝石系统(SAPHIRE)的评估:一种医学文献索引与检索的自动化方法。
Proc Annu Symp Comput Appl Med Care. 1991:808-12.
8
EBIMed--text crunching to gather facts for proteins from Medline.EBIMed——通过文本处理从医学在线数据库中收集蛋白质相关事实。
Bioinformatics. 2007 Jan 15;23(2):e237-44. doi: 10.1093/bioinformatics/btl302.
9
Literature mining and database annotation of protein phosphorylation using a rule-based system.使用基于规则的系统对蛋白质磷酸化进行文献挖掘和数据库注释。
Bioinformatics. 2005 Jun 1;21(11):2759-65. doi: 10.1093/bioinformatics/bti390. Epub 2005 Apr 6.
10
Using discourse analysis to improve text categorization in MEDLINE.运用话语分析改进医学在线数据库(MEDLINE)中的文本分类
Stud Health Technol Inform. 2007;129(Pt 1):710-5.

引用本文的文献

1
The influence of prompt engineering on large language models for protein-protein interaction identification in biomedical literature.提示工程对生物医学文献中蛋白质-蛋白质相互作用识别的大语言模型的影响。
Sci Rep. 2025 May 3;15(1):15493. doi: 10.1038/s41598-025-99290-4.
2
An Accurate and Efficient Approach to Knowledge Extraction from Scientific Publications Using Structured Ontology Models, Graph Neural Networks, and Large Language Models.利用结构化本体模型、图神经网络和大型语言模型从科学出版物中进行准确高效的知识提取。
Int J Mol Sci. 2024 Nov 3;25(21):11811. doi: 10.3390/ijms252111811.
3
Evaluating GPT and BERT models for protein-protein interaction identification in biomedical text.
评估GPT和BERT模型用于生物医学文本中蛋白质-蛋白质相互作用的识别
Bioinform Adv. 2024 Sep 11;4(1):vbae133. doi: 10.1093/bioadv/vbae133. eCollection 2024.
4
Evaluation of GPT and BERT-based models on identifying proteinprotein interactions in biomedical text.基于GPT和BERT模型在生物医学文本中识别蛋白质-蛋白质相互作用的评估
ArXiv. 2023 Dec 13:arXiv:2303.17728v2.
5
Surveying biomedical relation extraction: a critical examination of current datasets and the proposal of a new resource.调查生物医学关系抽取:对当前数据集的批判性考察及新资源的提出。
Brief Bioinform. 2024 Mar 27;25(3). doi: 10.1093/bib/bbae132.
6
BertSRC: transformer-based semantic relation classification.BertSRC:基于转换器的语义关系分类。
BMC Med Inform Decis Mak. 2022 Sep 6;22(1):234. doi: 10.1186/s12911-022-01977-5.
7
GeneCup: mining PubMed and GWAS catalog for gene-keyword relationships.GeneCup:从 PubMed 和 GWAS 目录中挖掘基因-关键词关系。
G3 (Bethesda). 2022 May 6;12(5). doi: 10.1093/g3journal/jkac059.
8
Mining Early Life Risk and Resiliency Factors and Their Influences in Human Populations from PubMed: A Machine Learning Approach to Discover DOHaD Evidence.从PubMed挖掘人类群体中的早期生活风险和复原力因素及其影响:一种发现发育起源健康与疾病证据的机器学习方法
J Pers Med. 2021 Oct 22;11(11):1064. doi: 10.3390/jpm11111064.
9
Distantly supervised biomedical relation extraction using piecewise attentive convolutional neural network and reinforcement learning.基于分段注意卷积神经网络和强化学习的远距离监督生物医学关系抽取。
J Am Med Inform Assoc. 2021 Nov 25;28(12):2571-2581. doi: 10.1093/jamia/ocab176.
10
Constructing knowledge graphs and their biomedical applications.构建知识图谱及其生物医学应用。
Comput Struct Biotechnol J. 2020 Jun 2;18:1414-1428. doi: 10.1016/j.csbj.2020.05.017. eCollection 2020.