• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于比较毒理基因组学数据库的生物医学文献分类与优先级排序

Classification and prioritization of biomedical literature for the comparative toxicogenomics database.

作者信息

Vishnyakova Dina, Pasche Emilie, Gobeill Julien, Gaudinat Arnaud, Lovis Christian, Ruch Patrick

机构信息

University Hospitals of Geneva, Geneva, Switzerland.

出版信息

Stud Health Technol Inform. 2012;180:210-4.

PMID:22874182
Abstract

We present a new approach to perform biomedical documents classification and prioritization for the Comparative Toxicogenomics Database (CTD). This approach is motivated by needs such as literature curation, in particular applied to the human health environment domain. The unique integration of chemical, genes/proteins and disease data in the biomedical literature may advance the identification of exposure and disease biomarkers, mechanisms of chemical actions, and the complex aetiologies of chronic diseases. Our approach aims to assist biomedical researchers when searching for relevant articles for CTD. The task is functionally defined as a binary classification task, where selected articles must also be ranked by order of relevance. We design a SVM classifier, which combines three main feature sets: an information retrieval system (EAGLi), a biomedical named-entity recognizer (MeSH term extraction), a gene normalization (GN) service (NormaGene) and an ad-hoc keyword recognizer for diseases and chemicals. The evaluation of the gene identification module was done on BioCreativeIII test data. Disease normalization is achieved with 95% precision and 93% of recall. The evaluation of the classification was done on the corpus provided by BioCreative organizers in 2012. The approach showed promising performance on the test data.

摘要

我们提出了一种新方法,用于对比较毒理基因组学数据库(CTD)的生物医学文献进行分类和排序。这种方法是由文献编目等需求推动的,特别是应用于人类健康环境领域。生物医学文献中化学、基因/蛋白质和疾病数据的独特整合,可能会推动暴露和疾病生物标志物的识别、化学作用机制以及慢性病复杂病因的研究。我们的方法旨在帮助生物医学研究人员为CTD搜索相关文章。该任务在功能上被定义为一个二元分类任务,其中所选文章还必须按相关性顺序进行排序。我们设计了一个支持向量机分类器,它结合了三个主要特征集:一个信息检索系统(EAGLi)、一个生物医学命名实体识别器(医学主题词提取)、一个基因归一化(GN)服务(NormaGene)以及一个针对疾病和化学物质的临时关键词识别器。基因识别模块的评估是在BioCreativeIII测试数据上进行的。疾病归一化的精确率达到95%,召回率达到93%。分类评估是在BioCreative组织者于2012年提供的语料库上进行的。该方法在测试数据上显示出了良好的性能。

相似文献

1
Classification and prioritization of biomedical literature for the comparative toxicogenomics database.用于比较毒理基因组学数据库的生物医学文献分类与优先级排序
Stud Health Technol Inform. 2012;180:210-4.
2
Using binary classification to prioritize and curate articles for the Comparative Toxicogenomics Database.使用二进制分类对比较毒理学基因组学数据库中的文章进行优先级排序和精选。
Database (Oxford). 2012 Dec 5;2012:bas050. doi: 10.1093/database/bas050. Print 2012.
3
Utilization of ontology look-up services in information retrieval for biomedical literature.本体查找服务在生物医学文献信息检索中的应用
Stud Health Technol Inform. 2013;186:155-9.
4
Pathogens and gene product normalization in the biomedical literature.生物医学文献中的病原体与基因产物标准化
Stud Health Technol Inform. 2012;174:89-93.
5
Recognizing names in biomedical texts: a machine learning approach.识别生物医学文本中的名称:一种机器学习方法。
Bioinformatics. 2004 May 1;20(7):1178-90. doi: 10.1093/bioinformatics/bth060. Epub 2004 Feb 10.
6
Classification methods for finding articles describing protein-protein interactions in PubMed.在PubMed中查找描述蛋白质-蛋白质相互作用文章的分类方法。
J Integr Bioinform. 2011 Sep 16;8(3):178. doi: 10.2390/biecoll-jib-2011-178.
7
BioCreative V CDR task corpus: a resource for chemical disease relation extraction.生物创意V化学疾病关系提取任务语料库:化学疾病关系提取的资源。
Database (Oxford). 2016 May 9;2016. doi: 10.1093/database/baw068. Print 2016.
8
Collaborative biocuration--text-mining development task for document prioritization for curation.协作生物注释——用于文档优先级排序的文本挖掘开发任务,以便进行注释。
Database (Oxford). 2012 Nov 22;2012:bas037. doi: 10.1093/database/bas037. Print 2012.
9
Prioritizing PubMed articles for the Comparative Toxicogenomic Database utilizing semantic information.利用语义信息为比较毒理学基因组数据库对 PubMed 文章进行优先级排序。
Database (Oxford). 2012 Nov 17;2012:bas042. doi: 10.1093/database/bas042. Print 2012.
10
Targeted journal curation as a method to improve data currency at the Comparative Toxicogenomics Database.靶向期刊策展作为一种提高比较毒理学基因组学数据库数据时效性的方法。
Database (Oxford). 2012 Dec 6;2012:bas051. doi: 10.1093/database/bas051. Print 2012.

引用本文的文献

1
A Narrative Literature Review of Natural Language Processing Applied to the Occupational Exposome.自然语言处理在职业外核组学中的应用的叙事文献综述。
Int J Environ Res Public Health. 2022 Jul 13;19(14):8544. doi: 10.3390/ijerph19148544.