• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在本体论背景下对模式生物的基因调控进行大规模提取。

Large-scale extraction of gene regulation for model organisms in an ontological context.

作者信息

Saric Jasmin, Jensen Lars J, Rojas Isabel

机构信息

European Media Laboratory GmbH, D-69118 Heidelberg, Germany.

出版信息

In Silico Biol. 2005;5(1):21-32.

PMID:15972005
Abstract

This paper presents an approach using syntactosemantic rules for the extraction of relational information from biomedical abstracts. The results show that by overcoming the hurdle of technical terminology, high precision results can be achieved. From abstracts related to baker's yeast, we manage to extract a regulatory network comprised of 441 pairwise relations from 58,664 abstracts with an accuracy of 83 - 90%. To achieve this, we made use of a resource of gene/protein names considerably larger than those used in most other biology related information extraction approaches. This list of names was included in the lexicon of our retrained partof- speech tagger for use on molecular biology abstracts. For the domain in question an accuracy of 93.6 - 97.7% was attained on Part-of-speech-tags. The method can be easily adapted to other organisms than yeast, allowing us to extract many more biologically relevant relations. The main reason for the comparable precision rates is the ontological model that was built beforehand and served as a guiding force for the manual coding of the syntactosemantic rules.

摘要

本文提出了一种利用句法语义规则从生物医学摘要中提取关系信息的方法。结果表明,通过克服技术术语的障碍,可以获得高精度的结果。从与面包酵母相关的摘要中,我们成功地从58664篇摘要中提取了一个由441对关系组成的调控网络,准确率为83%-90%。为了实现这一点,我们使用了一个比大多数其他生物相关信息提取方法所使用的基因/蛋白质名称资源大得多的资源。这个名称列表被包含在我们重新训练的词性标注器的词汇表中,用于分子生物学摘要。对于所讨论的领域,词性标注的准确率达到了93.6%-97.7%。该方法可以很容易地适用于酵母以外的其他生物体,使我们能够提取更多生物学相关的关系。可比精度率的主要原因是预先构建的本体模型,它作为句法语义规则手动编码的指导力量。

相似文献

1
Large-scale extraction of gene regulation for model organisms in an ontological context.在本体论背景下对模式生物的基因调控进行大规模提取。
In Silico Biol. 2005;5(1):21-32.
2
Extraction of regulatory gene/protein networks from Medline.从医学在线数据库中提取调控基因/蛋白质网络。
Bioinformatics. 2006 Mar 15;22(6):645-50. doi: 10.1093/bioinformatics/bti597. Epub 2005 Jul 26.
3
Comparison of character-level and part of speech features for name recognition in biomedical texts.生物医学文本中用于名称识别的字符级特征与词性特征比较。
J Biomed Inform. 2004 Dec;37(6):423-35. doi: 10.1016/j.jbi.2004.08.008.
4
Gene name identification and normalization using a model organism database.使用模式生物数据库进行基因名称识别与标准化
J Biomed Inform. 2004 Dec;37(6):396-410. doi: 10.1016/j.jbi.2004.08.010.
5
Automatic term list generation for entity tagging.用于实体标记的自动术语列表生成。
Bioinformatics. 2006 Mar 15;22(6):651-7. doi: 10.1093/bioinformatics/bti733. Epub 2005 Oct 25.
6
Term identification in the biomedical literature.生物医学文献中的术语识别。
J Biomed Inform. 2004 Dec;37(6):512-26. doi: 10.1016/j.jbi.2004.08.004.
7
Using name-internal and contextual features to classify biological terms.利用名称内部特征和上下文特征对生物学术语进行分类。
J Biomed Inform. 2004 Dec;37(6):498-511. doi: 10.1016/j.jbi.2004.08.007.
8
An automated procedure to identify biomedical articles that contain cancer-associated gene variants.一种识别包含癌症相关基因变异的生物医学文章的自动化程序。
Hum Mutat. 2006 Sep;27(9):957-64. doi: 10.1002/humu.20363.
9
Enhancing HMM-based biomedical named entity recognition by studying special phenomena.通过研究特殊现象增强基于隐马尔可夫模型的生物医学命名实体识别
J Biomed Inform. 2004 Dec;37(6):411-22. doi: 10.1016/j.jbi.2004.08.005.
10
Gene symbol disambiguation using knowledge-based profiles.使用基于知识的概况进行基因符号消歧。
Bioinformatics. 2007 Apr 15;23(8):1015-22. doi: 10.1093/bioinformatics/btm056. Epub 2007 Feb 21.

引用本文的文献

1
Graph theory enables drug repurposing--how a mathematical model can drive the discovery of hidden mechanisms of action.图论可实现药物再利用——数学模型如何推动隐藏作用机制的发现。
PLoS One. 2014 Jan 9;9(1):e84912. doi: 10.1371/journal.pone.0084912. eCollection 2014.
2
Text-mining solutions for biomedical research: enabling integrative biology.文本挖掘在生物医学研究中的应用:实现综合生物学。
Nat Rev Genet. 2012 Dec;13(12):829-39. doi: 10.1038/nrg3337. Epub 2012 Nov 14.
3
Improving the extraction of complex regulatory events from scientific text by using ontology-based inference.
通过基于本体的推理改进从科学文本中提取复杂调控事件的方法。
J Biomed Semantics. 2011 Oct 6;2 Suppl 5(Suppl 5):S3. doi: 10.1186/2041-1480-2-S5-S3.
4
Text-mining assisted regulatory annotation.文本挖掘辅助的监管注释。
Genome Biol. 2008;9(2):R31. doi: 10.1186/gb-2008-9-2-r31. Epub 2008 Feb 13.
5
BioCAD: an information fusion platform for bio-network inference and analysis.BioCAD:一个用于生物网络推理与分析的信息融合平台。
BMC Bioinformatics. 2007 Nov 27;8 Suppl 9(Suppl 9):S2. doi: 10.1186/1471-2105-8-S9-S2.
6
Automatic reconstruction of a bacterial regulatory network using Natural Language Processing.使用自然语言处理自动重建细菌调控网络。
BMC Bioinformatics. 2007 Aug 7;8:293. doi: 10.1186/1471-2105-8-293.
7
Term identification methods for consumer health vocabulary development.用于消费者健康词汇发展的术语识别方法。
J Med Internet Res. 2007 Feb 28;9(1):e4. doi: 10.2196/jmir.9.1.e4.