• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 OntoGene 流水线进行 BioCreative 2012 的分诊任务。

Using the OntoGene pipeline for the triage task of BioCreative 2012.

机构信息

Institute of Computational Linguistics, University of Zurich, Binzmuhlestrasse 14, Zurich 8050, Switzerland.

出版信息

Database (Oxford). 2013 Feb 9;2013:bas053. doi: 10.1093/database/bas053. Print 2013.

DOI:10.1093/database/bas053
PMID:23396322
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3568389/
Abstract

In this article, we describe the architecture of the OntoGene Relation mining pipeline and its application in the triage task of BioCreative 2012. The aim of the task is to support the triage of abstracts relevant to the process of curation of the Comparative Toxicogenomics Database. We use a conventional information retrieval system (Lucene) to provide a baseline ranking, which we then combine with information provided by our relation mining system, in order to achieve an optimized ranking. Our approach additionally delivers domain entities mentioned in each input document as well as candidate relationships, both ranked according to a confidence score computed by the system. This information is presented to the user through an advanced interface aimed at supporting the process of interactive curation. Thanks, in particular, to the high-quality entity recognition, the OntoGene system achieved the best overall results in the task.

摘要

在本文中,我们描述了 OntoGene 关系挖掘管道的架构及其在 BioCreative 2012 分诊任务中的应用。该任务的目的是支持与比较毒理学基因组数据库编纂过程相关的摘要的分诊。我们使用传统的信息检索系统(Lucene)提供基线排名,然后将其与我们的关系挖掘系统提供的信息结合起来,以实现优化的排名。我们的方法还提供了在每个输入文档中提到的领域实体以及候选关系,根据系统计算的置信度得分进行排名。该信息通过一个旨在支持交互式编纂过程的高级界面呈现给用户。特别是由于高质量的实体识别,OntoGene 系统在任务中取得了最佳的整体结果。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/fc291e183e9d/bas053f5p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/8ddf47a543c2/bas053f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/57bde3c1b6c7/bas053f2p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/ec9f773d3757/bas053f3p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/d47d9b4fd432/bas053f4p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/fc291e183e9d/bas053f5p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/8ddf47a543c2/bas053f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/57bde3c1b6c7/bas053f2p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/ec9f773d3757/bas053f3p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/d47d9b4fd432/bas053f4p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d040/3568389/fc291e183e9d/bas053f5p.jpg

相似文献

1
Using the OntoGene pipeline for the triage task of BioCreative 2012.使用 OntoGene 流水线进行 BioCreative 2012 的分诊任务。
Database (Oxford). 2013 Feb 9;2013:bas053. doi: 10.1093/database/bas053. Print 2013.
2
Using binary classification to prioritize and curate articles for the Comparative Toxicogenomics Database.使用二进制分类对比较毒理学基因组学数据库中的文章进行优先级排序和精选。
Database (Oxford). 2012 Dec 5;2012:bas050. doi: 10.1093/database/bas050. Print 2012.
3
Collaborative biocuration--text-mining development task for document prioritization for curation.协作生物注释——用于文档优先级排序的文本挖掘开发任务,以便进行注释。
Database (Oxford). 2012 Nov 22;2012:bas037. doi: 10.1093/database/bas037. Print 2012.
4
Classification and prioritization of biomedical literature for the comparative toxicogenomics database.用于比较毒理基因组学数据库的生物医学文献分类与优先级排序
Stud Health Technol Inform. 2012;180:210-4.
5
BioCreative III interactive task: an overview.BioCreative III 交互式任务概述。
BMC Bioinformatics. 2011 Oct 3;12 Suppl 8(Suppl 8):S4. doi: 10.1186/1471-2105-12-S8-S4.
6
Text mining effectively scores and ranks the literature for improving chemical-gene-disease curation at the comparative toxicogenomics database.文本挖掘有效地对文献进行评分和排序,以提高比较毒理学基因组学数据库中的化学物质-基因-疾病的编纂工作。
PLoS One. 2013 Apr 17;8(4):e58201. doi: 10.1371/journal.pone.0058201. Print 2013.
7
Argo: enabling the development of bespoke workflows and services for disease annotation.阿尔戈:助力开发用于疾病注释的定制工作流程和服务。
Database (Oxford). 2016 May 17;2016. doi: 10.1093/database/baw066. Print 2016.
8
Web services-based text-mining demonstrates broad impacts for interoperability and process simplification.基于网络服务的文本挖掘对互操作性和流程简化具有广泛影响。
Database (Oxford). 2014 Jun 10;2014. doi: 10.1093/database/bau050. Print 2014.
9
tagtog: interactive and text-mining-assisted annotation of gene mentions in PLOS full-text articles.tagtog:在 PLoS 全文文章中进行基因提及的交互式和文本挖掘辅助注释。
Database (Oxford). 2014 Apr 7;2014(0):bau033. doi: 10.1093/database/bau033. Print 2014.
10
Overview of the gene ontology task at BioCreative IV.生物创意IV基因本体任务概述。
Database (Oxford). 2014 Aug 25;2014. doi: 10.1093/database/bau086. Print 2014.

引用本文的文献

1
Automated recognition of functional compound-protein relationships in literature.文献中功能化合物-蛋白质关系的自动识别。
PLoS One. 2020 Mar 3;15(3):e0220925. doi: 10.1371/journal.pone.0220925. eCollection 2020.
2
Improving biocuration of microRNAs in diseases: a case study in idiopathic pulmonary fibrosis.改善疾病中微小RNA的生物编目:以特发性肺纤维化为例
Database (Oxford). 2017 Jan 1;2017. doi: 10.1093/database/bax030.
3
Effective biomedical document classification for identifying publications relevant to the mouse Gene Expression Database (GXD).

本文引用的文献

1
Collaborative biocuration--text-mining development task for document prioritization for curation.协作生物注释——用于文档优先级排序的文本挖掘开发任务,以便进行注释。
Database (Oxford). 2012 Nov 22;2012:bas037. doi: 10.1093/database/bas037. Print 2012.
2
Ranking relations between diseases, drugs and genes for a curation task.针对一项整理任务的疾病、药物和基因之间的排名关系。
J Biomed Semantics. 2012 Oct 5;3 Suppl 3(Suppl 3):S5. doi: 10.1186/2041-1480-3-S3-S5.
3
Relation mining experiments in the pharmacogenomics domain.药物基因组学领域的关系挖掘实验。
用于识别与小鼠基因表达数据库(GXD)相关出版物的有效生物医学文献分类。
Database (Oxford). 2017 Jan 1;2017(1). doi: 10.1093/database/bax017.
4
Strategies towards digital and semi-automated curation in RegulonDB.RegulonDB中数字和半自动管理的策略。
Database (Oxford). 2017 Jan 1;2017(1). doi: 10.1093/database/bax012.
5
Biocuration with insufficient resources and fixed timelines.在资源不足且时间线固定的情况下进行生物数据编目。
Database (Oxford). 2015 Dec 26;2015. doi: 10.1093/database/bav116. Print 2015.
6
Scaling drug indication curation through crowdsourcing.通过众包扩大药物适应症整理规模。
Database (Oxford). 2015 Mar 22;2015. doi: 10.1093/database/bav016. Print 2015.
7
OntoGene web services for biomedical text mining.OntoGene 生物医学文本挖掘网络服务。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S6. doi: 10.1186/1471-2105-15-S14-S6. Epub 2014 Nov 27.
8
Web services-based text-mining demonstrates broad impacts for interoperability and process simplification.基于网络服务的文本挖掘对互操作性和流程简化具有广泛影响。
Database (Oxford). 2014 Jun 10;2014. doi: 10.1093/database/bau050. Print 2014.
9
Assisted curation of regulatory interactions and growth conditions of OxyR in E. coli K-12.大肠杆菌K-12中OxyR调控相互作用和生长条件的辅助整理
Database (Oxford). 2014 Jun 4;2014. doi: 10.1093/database/bau049. Print 2014.
10
BioC: a minimalist approach to interoperability for biomedical text processing.BioC:一种用于生物医学文本处理的最小互操作方法。
Database (Oxford). 2013 Sep 18;2013:bat064. doi: 10.1093/database/bat064. Print 2013.
J Biomed Inform. 2012 Oct;45(5):851-61. doi: 10.1016/j.jbi.2012.04.014. Epub 2012 May 10.
4
Using ODIN for a PharmGKB revalidation experiment.使用 ODIN 进行 PharmGKB 再验证实验。
Database (Oxford). 2012 Apr 23;2012:bas021. doi: 10.1093/database/bas021. Print 2012.
5
Assessment of NER solutions against the first and second CALBC Silver Standard Corpus.针对首个和第二个CALBC银标准语料库对命名实体识别解决方案进行评估。
J Biomed Semantics. 2011 Oct 6;2 Suppl 5(Suppl 5):S11. doi: 10.1186/2041-1480-2-S5-S11.
6
BioCreative III interactive task: an overview.BioCreative III 交互式任务概述。
BMC Bioinformatics. 2011 Oct 3;12 Suppl 8(Suppl 8):S4. doi: 10.1186/1471-2105-12-S8-S4.
7
The Protein-Protein Interaction tasks of BioCreative III: classification/ranking of articles and linking bio-ontology concepts to full text.BioCreative III 的蛋白质-蛋白质相互作用任务:文章的分类/排序和将生物本体论概念链接到全文。
BMC Bioinformatics. 2011 Oct 3;12 Suppl 8(Suppl 8):S3. doi: 10.1186/1471-2105-12-S8-S3.
8
Terminological resources for text mining over biomedical scientific literature.生物医学文献文本挖掘的术语资源。
Artif Intell Med. 2011 Jun;52(2):107-14. doi: 10.1016/j.artmed.2011.04.011. Epub 2011 Jun 11.
9
PharmGKB: understanding the effects of individual genetic variants.药物基因组学知识库:了解个体基因变异的影响。
Drug Metab Rev. 2008;40(4):539-51. doi: 10.1080/03602530802413338.
10
OntoGene in BioCreative II.生物创意II中的OntoGene。
Genome Biol. 2008;9 Suppl 2(Suppl 2):S13. doi: 10.1186/gb-2008-9-s2-s13. Epub 2008 Sep 1.