• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一个用于在大量注释语料库上进行关系挖掘的环境:以GENIA语料库为例。

An environment for relation mining over richly annotated corpora: the case of GENIA.

作者信息

Rinaldi Fabio, Schneider Gerold, Kaljurand Kaarel, Hess Michael, Romacker Martin

机构信息

Institute of Computational Linguistics, IFI, University of Zurich, Switzerland.

出版信息

BMC Bioinformatics. 2006 Nov 24;7 Suppl 3(Suppl 3):S3. doi: 10.1186/1471-2105-7-S3-S3.

DOI:10.1186/1471-2105-7-S3-S3
PMID:17134476
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC1764447/
Abstract

BACKGROUND

The biomedical domain is witnessing a rapid growth of the amount of published scientific results, which makes it increasingly difficult to filter the core information. There is a real need for support tools that 'digest' the published results and extract the most important information.

RESULTS

We describe and evaluate an environment supporting the extraction of domain-specific relations, such as protein-protein interactions, from a richly-annotated corpus. We use full, deep-linguistic parsing and manually created, versatile patterns, expressing a large set of syntactic alternations, plus semantic ontology information.

CONCLUSION

The experiments show that our approach described is capable of delivering high-precision results, while maintaining sufficient levels of recall. The high level of abstraction of the rules used by the system, which are considerably more powerful and versatile than finite-state approaches, allows speedy interactive development and validation.

摘要

背景

生物医学领域发表的科学成果数量正在迅速增长,这使得筛选核心信息变得越来越困难。确实需要能够“消化”已发表成果并提取最重要信息的支持工具。

结果

我们描述并评估了一个支持从丰富注释语料库中提取特定领域关系(如蛋白质-蛋白质相互作用)的环境。我们使用完整的深度语言解析以及手动创建的通用模式,这些模式表达了大量的句法变化,再加上语义本体信息。

结论

实验表明,我们所描述的方法能够提供高精度的结果,同时保持足够的召回率。系统使用的规则具有高度抽象性,比有限状态方法更强大、更通用,这使得能够快速进行交互式开发和验证。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e7c6/1764447/0e88da887ecc/1471-2105-7-S3-S3-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e7c6/1764447/a0434fb3bd0d/1471-2105-7-S3-S3-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e7c6/1764447/0e88da887ecc/1471-2105-7-S3-S3-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e7c6/1764447/a0434fb3bd0d/1471-2105-7-S3-S3-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e7c6/1764447/0e88da887ecc/1471-2105-7-S3-S3-2.jpg

相似文献

1
An environment for relation mining over richly annotated corpora: the case of GENIA.一个用于在大量注释语料库上进行关系挖掘的环境:以GENIA语料库为例。
BMC Bioinformatics. 2006 Nov 24;7 Suppl 3(Suppl 3):S3. doi: 10.1186/1471-2105-7-S3-S3.
2
Recognizing names in biomedical texts: a machine learning approach.识别生物医学文本中的名称:一种机器学习方法。
Bioinformatics. 2004 May 1;20(7):1178-90. doi: 10.1093/bioinformatics/bth060. Epub 2004 Feb 10.
3
Mining of relations between proteins over biomedical scientific literature using a deep-linguistic approach.使用深度语言方法挖掘生物医学科学文献中蛋白质之间的关系。
Artif Intell Med. 2007 Feb;39(2):127-36. doi: 10.1016/j.artmed.2006.08.005. Epub 2006 Oct 18.
4
Automatic recognition of topic-classified relations between prostate cancer and genes using MEDLINE abstracts.利用医学在线摘要自动识别前列腺癌与基因之间的主题分类关系。
BMC Bioinformatics. 2006 Nov 24;7 Suppl 3(Suppl 3):S4. doi: 10.1186/1471-2105-7-S3-S4.
5
A hybrid method for relation extraction from biomedical literature.一种从生物医学文献中提取关系的混合方法。
Int J Med Inform. 2006 Jun;75(6):443-55. doi: 10.1016/j.ijmedinf.2005.06.010. Epub 2005 Aug 10.
6
The interaction of domain knowledge and linguistic structure in natural language processing: interpreting hypernymic propositions in biomedical text.自然语言处理中领域知识与语言结构的相互作用:解读生物医学文本中的上位命题
J Biomed Inform. 2003 Dec;36(6):462-77. doi: 10.1016/j.jbi.2003.11.003.
7
A critical review of PASBio's argument structures for biomedical verbs.对PASBio关于生物医学动词的论证结构的批判性综述。
BMC Bioinformatics. 2006 Nov 24;7 Suppl 3(Suppl 3):S5. doi: 10.1186/1471-2105-7-S3-S5.
8
Distributed modules for text annotation and IE applied to the biomedical domain.应用于生物医学领域的文本注释和信息提取的分布式模块。
Int J Med Inform. 2006 Jun;75(6):496-500. doi: 10.1016/j.ijmedinf.2005.06.011. Epub 2005 Aug 8.
9
Literature mining and database annotation of protein phosphorylation using a rule-based system.使用基于规则的系统对蛋白质磷酸化进行文献挖掘和数据库注释。
Bioinformatics. 2005 Jun 1;21(11):2759-65. doi: 10.1093/bioinformatics/bti390. Epub 2005 Apr 6.
10
Corpus annotation for mining biomedical events from literature.用于从文献中挖掘生物医学事件的语料库标注。
BMC Bioinformatics. 2008 Jan 8;9:10. doi: 10.1186/1471-2105-9-10.

引用本文的文献

1
Strategies towards digital and semi-automated curation in RegulonDB.RegulonDB中数字和半自动管理的策略。
Database (Oxford). 2017 Jan 1;2017(1). doi: 10.1093/database/bax012.
2
Sequential pattern mining for discovering gene interactions and their contextual information from biomedical texts.用于从生物医学文本中发现基因相互作用及其上下文信息的序列模式挖掘
J Biomed Semantics. 2015 May 18;6:27. doi: 10.1186/s13326-015-0023-3. eCollection 2015.
3
Wide-coverage relation extraction from MEDLINE using deep syntax.使用深度句法从医学文献数据库(MEDLINE)中进行广泛覆盖的关系提取。

本文引用的文献

1
Mining of relations between proteins over biomedical scientific literature using a deep-linguistic approach.使用深度语言方法挖掘生物医学科学文献中蛋白质之间的关系。
Artif Intell Med. 2007 Feb;39(2):127-36. doi: 10.1016/j.artmed.2006.08.005. Epub 2006 Oct 18.
2
Literature mining for the biologist: from information retrieval to biological discovery.面向生物学家的文献挖掘:从信息检索到生物学发现
Nat Rev Genet. 2006 Feb;7(2):119-29. doi: 10.1038/nrg1768.
3
Extraction of regulatory gene/protein networks from Medline.从医学在线数据库中提取调控基因/蛋白质网络。
BMC Bioinformatics. 2015 Apr 1;16:107. doi: 10.1186/s12859-015-0538-8.
4
Domain adaption of parsing for operative notes.手术记录解析的领域适应
J Biomed Inform. 2015 Apr;54:1-9. doi: 10.1016/j.jbi.2015.01.016. Epub 2015 Feb 7.
5
Using the OntoGene pipeline for the triage task of BioCreative 2012.使用 OntoGene 流水线进行 BioCreative 2012 的分诊任务。
Database (Oxford). 2013 Feb 9;2013:bas053. doi: 10.1093/database/bas053. Print 2013.
6
An analysis of gene/protein associations at PubMed scale.在PubMed规模上对基因/蛋白质关联进行的分析。
J Biomed Semantics. 2011 Oct 6;2 Suppl 5(Suppl 5):S5. doi: 10.1186/2041-1480-2-S5-S5.
7
Recent progress in automatically extracting information from the pharmacogenomic literature.从药物基因组学文献中自动提取信息的最新进展。
Pharmacogenomics. 2010 Oct;11(10):1467-89. doi: 10.2217/pgs.10.136.
8
Investigating heterogeneous protein annotations toward cross-corpora utilization.研究跨语料库利用的异构蛋白质注释。
BMC Bioinformatics. 2009 Dec 9;10:403. doi: 10.1186/1471-2105-10-403.
9
A bioinformatics analysis of the cell line nomenclature.细胞系命名法的生物信息学分析。
Bioinformatics. 2008 Dec 1;24(23):2760-6. doi: 10.1093/bioinformatics/btn502. Epub 2008 Oct 10.
10
OntoGene in BioCreative II.生物创意II中的OntoGene。
Genome Biol. 2008;9 Suppl 2(Suppl 2):S13. doi: 10.1186/gb-2008-9-s2-s13. Epub 2008 Sep 1.
Bioinformatics. 2006 Mar 15;22(6):645-50. doi: 10.1093/bioinformatics/bti597. Epub 2005 Jul 26.
4
Discovering patterns to extract protein-protein interactions from full texts.从全文中发现提取蛋白质-蛋白质相互作用的模式。
Bioinformatics. 2004 Dec 12;20(18):3604-12. doi: 10.1093/bioinformatics/bth451. Epub 2004 Jul 29.
5
BioRAT: extracting biological information from full-length papers.BioRAT:从全文论文中提取生物学信息。
Bioinformatics. 2004 Nov 22;20(17):3206-13. doi: 10.1093/bioinformatics/bth386. Epub 2004 Jul 1.
6
A shallow parser based on closed-class words to capture relations in biomedical text.一种基于封闭类词的浅层句法分析器,用于捕捉生物医学文本中的关系。
J Biomed Inform. 2003 Jun;36(3):145-58. doi: 10.1016/s1532-0464(03)00039-x.
7
MedScan, a natural language processing engine for MEDLINE abstracts.MedScan,一款用于医学在线数据库摘要的自然语言处理引擎。
Bioinformatics. 2003 Sep 1;19(13):1699-706. doi: 10.1093/bioinformatics/btg207.
8
GENIA corpus--semantically annotated corpus for bio-textmining.GENIA语料库——用于生物文本挖掘的语义标注语料库。
Bioinformatics. 2003;19 Suppl 1:i180-2. doi: 10.1093/bioinformatics/btg1023.
9
Kinase pathway database: an integrated protein-kinase and NLP-based protein-interaction resource.激酶途径数据库:一个基于整合蛋白激酶和自然语言处理的蛋白质相互作用资源库。
Genome Res. 2003 Jun;13(6A):1231-43. doi: 10.1101/gr.835903.
10
GENIES: a natural-language processing system for the extraction of molecular pathways from journal articles.GENIES:一种用于从期刊文章中提取分子通路的自然语言处理系统。
Bioinformatics. 2001;17 Suppl 1:S74-82. doi: 10.1093/bioinformatics/17.suppl_1.s74.