• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用互信息独立性模型和支持向量机加 sigmoid 函数识别生物医学文本中的名称。

Recognizing names in biomedical texts using mutual information independence model and SVM plus sigmoid.

作者信息

Zhou G D

机构信息

Institute for Infocomm Research, 21 Heng Mui Keng Terrace, Singapore 119613, Singapore.

出版信息

Int J Med Inform. 2006 Jun;75(6):456-67. doi: 10.1016/j.ijmedinf.2005.06.012. Epub 2005 Aug 19.

DOI:10.1016/j.ijmedinf.2005.06.012
PMID:16112894
Abstract

In this paper, we present a biomedical name recognition system, called PowerBioNE. In order to deal with the special phenomena in the biomedical domain, various evidential features are proposed and integrated through a mutual information independence model (MIIM). In addition, a support vector machine (SVM) plus sigmoid is proposed to resolve the data sparseness problem in the MIIM. In this way, the data sparseness problem in MIIM-based biomedical name recognition can be resolved effectively and a biomedical name recognition system with better performance and better portability can be achieved. Finally, we present two post-processing modules to deal with the nested entity name and abbreviation phenomena in the biomedical domain to further improve the performance. Evaluation shows that our system achieves F-measures of 69.1 and 71.2 on the 23 classes of GENIA V1.1 and V3.0, respectively. In particular, our system achieves an F-measure of 77.8 on the "protein" class of GENIA V3.0. It also shows that our system outperforms the best-reported system on GENIA V1.1 and V3.0.

摘要

在本文中,我们提出了一个名为PowerBioNE的生物医学命名识别系统。为了处理生物医学领域中的特殊现象,我们提出了各种证据特征,并通过互信息独立性模型(MIIM)进行整合。此外,还提出了一种支持向量机(SVM)加sigmoid的方法来解决MIIM中的数据稀疏问题。通过这种方式,可以有效解决基于MIIM的生物医学命名识别中的数据稀疏问题,并实现性能更好、可移植性更强的生物医学命名识别系统。最后,我们提出了两个后处理模块来处理生物医学领域中的嵌套实体名称和缩写现象,以进一步提高性能。评估表明,我们的系统在GENIA V1.1和V3.0的23个类别上分别达到了69.1和71.2的F值。特别是,我们的系统在GENIA V3.0的“蛋白质”类别上达到了77.8的F值。这也表明我们的系统在GENIA V1.1和V3.0上优于已报道的最佳系统。

相似文献

1
Recognizing names in biomedical texts using mutual information independence model and SVM plus sigmoid.使用互信息独立性模型和支持向量机加 sigmoid 函数识别生物医学文本中的名称。
Int J Med Inform. 2006 Jun;75(6):456-67. doi: 10.1016/j.ijmedinf.2005.06.012. Epub 2005 Aug 19.
2
Recognizing names in biomedical texts: a machine learning approach.识别生物医学文本中的名称:一种机器学习方法。
Bioinformatics. 2004 May 1;20(7):1178-90. doi: 10.1093/bioinformatics/bth060. Epub 2004 Feb 10.
3
Enhancing HMM-based biomedical named entity recognition by studying special phenomena.通过研究特殊现象增强基于隐马尔可夫模型的生物医学命名实体识别
J Biomed Inform. 2004 Dec;37(6):411-22. doi: 10.1016/j.jbi.2004.08.005.
4
Comparison of character-level and part of speech features for name recognition in biomedical texts.生物医学文本中用于名称识别的字符级特征与词性特征比较。
J Biomed Inform. 2004 Dec;37(6):423-35. doi: 10.1016/j.jbi.2004.08.008.
5
A hybrid method for relation extraction from biomedical literature.一种从生物医学文献中提取关系的混合方法。
Int J Med Inform. 2006 Jun;75(6):443-55. doi: 10.1016/j.ijmedinf.2005.06.010. Epub 2005 Aug 10.
6
Using name-internal and contextual features to classify biological terms.利用名称内部特征和上下文特征对生物学术语进行分类。
J Biomed Inform. 2004 Dec;37(6):498-511. doi: 10.1016/j.jbi.2004.08.007.
7
Evaluation of two dependency parsers on biomedical corpus targeted at protein-protein interactions.针对蛋白质-蛋白质相互作用的生物医学语料库对两种依存句法分析器的评估。
Int J Med Inform. 2006 Jun;75(6):430-42. doi: 10.1016/j.ijmedinf.2005.06.009. Epub 2005 Aug 11.
8
Distributed modules for text annotation and IE applied to the biomedical domain.应用于生物医学领域的文本注释和信息提取的分布式模块。
Int J Med Inform. 2006 Jun;75(6):496-500. doi: 10.1016/j.ijmedinf.2005.06.011. Epub 2005 Aug 8.
9
Biomedical named entity recognition using two-phase model based on SVMs.基于支持向量机的两阶段模型的生物医学命名实体识别
J Biomed Inform. 2004 Dec;37(6):436-47. doi: 10.1016/j.jbi.2004.08.012.
10
Zone analysis in biology articles as a basis for information extraction.生物学文章中的区域分析作为信息提取的基础。
Int J Med Inform. 2006 Jun;75(6):468-87. doi: 10.1016/j.ijmedinf.2005.06.013. Epub 2005 Aug 19.

引用本文的文献

1
Transformer-based prototype network for Chinese nested named entity recognition.基于Transformer的中文嵌套命名实体识别原型网络
Sci Rep. 2025 Jun 5;15(1):19820. doi: 10.1038/s41598-025-04946-w.
2
Classification and Identification of Industrial Gases Based on Electronic Nose Technology.基于电子鼻技术的工业气体分类与识别。
Sensors (Basel). 2019 Nov 18;19(22):5033. doi: 10.3390/s19225033.
3
Unregistered biological words recognition by Q-learning with transfer learning.基于迁移学习的Q学习对未注册生物词汇的识别
ScientificWorldJournal. 2014 Feb 19;2014:173290. doi: 10.1155/2014/173290. eCollection 2014.
4
Predicting microRNA precursors with a generalized Gaussian components based density estimation algorithm.基于广义高斯成分密度估计算法预测 microRNA 前体。
BMC Bioinformatics. 2010 Jan 18;11 Suppl 1(Suppl 1):S52. doi: 10.1186/1471-2105-11-S1-S52.
5
Network integration and graph analysis in mammalian molecular systems biology.哺乳动物分子系统生物学中的网络整合与图分析
IET Syst Biol. 2008 Sep;2(5):206-21. doi: 10.1049/iet-syb:20070075.
6
Integrating high dimensional bi-directional parsing models for gene mention tagging.整合用于基因提及标记的高维双向解析模型。
Bioinformatics. 2008 Jul 1;24(13):i286-94. doi: 10.1093/bioinformatics/btn183.
7
xGENIA: A comprehensive OWL ontology based on the GENIA corpus.xGENIA:一个基于GENIA语料库的综合OWL本体。
Bioinformation. 2007 Mar 20;1(9):360-2. doi: 10.6026/97320630001360.
8
Various criteria in the evaluation of biomedical named entity recognition.生物医学命名实体识别评估中的各种标准。
BMC Bioinformatics. 2006 Feb 24;7:92. doi: 10.1186/1471-2105-7-92.