Suppr超能文献

使用基于Transformer的模型增强MEDLINE引文的自动PT标注

Enhancing Automatic PT Tagging for MEDLINE Citations Using Transformer-Based Models.

作者信息

Cid Victor H, Mork James

机构信息

National Library of Medicine, Bethesda, Maryland, US.

出版信息

ArXiv. 2025 Jun 3:arXiv:2506.03321v1.

Abstract

We investigated the feasibility of predicting Medical Subject Headings (MeSH) Publication Types (PTs) from MEDLINE citation metadata using pre-trained Transformer-based models BERT and DistilBERT. This study addresses limitations in the current automated indexing process, which relies on legacy NLP algorithms. We evaluated monolithic multi-label classifiers and binary classifier ensembles to enhance the retrieval of biomedical literature. Results demonstrate the potential of Transformer models to significantly improve PT tagging accuracy, paving the way for scalable, efficient biomedical indexing.

摘要

我们研究了使用预训练的基于Transformer的模型BERT和DistilBERT从MEDLINE引文元数据预测医学主题词(MeSH)出版类型(PTs)的可行性。本研究解决了当前自动索引过程中依赖传统自然语言处理算法的局限性。我们评估了整体多标签分类器和二元分类器集成,以增强生物医学文献的检索。结果表明,Transformer模型有潜力显著提高PT标签的准确性,为可扩展、高效的生物医学索引铺平了道路。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2c6b/12306818/7aef44a32fed/nihpp-2506.03321v1-f0001.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验