• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过机器学习为神经退行性疾病研究人员进行知识发现。

Knowledge discovery via machine learning for neurodegenerative disease researchers.

作者信息

Ozyurt I Burak, Brown Gregory G

机构信息

Department of Psychiatry, University of California - San Diego, La Jolla, CA, USA.

出版信息

Methods Mol Biol. 2009;569:173-96. doi: 10.1007/978-1-59745-524-4_9.

DOI:10.1007/978-1-59745-524-4_9
PMID:19623491
Abstract

Ever-increasing size of the biomedical literature makes more precise information retrieval and tapping into implicit knowledge in scientific literature a necessity. In this chapter, first, three new variants of the expectation-maximization (EM) method for semisupervised document classification (Machine Learning 39:103-134, 2000) are introduced to refine biomedical literature meta-searches. The retrieval performance of a multi-mixture per class EM variant with Agglomerative Information Bottleneck clustering (Slonim and Tishby (1999) Agglomerative information bottleneck. In Proceedings of NIPS-12) using Davies-Bouldin cluster validity index (IEEE Transactions on Pattern Analysis and Machine Intelligence 1:224-227, 1979), rivaled the state-of-the-art transductive support vector machines (TSVM) (Joachims (1999) Transductive inference for text classification using support vector machines. In Proceedings of the International Conference on Machine Learning (ICML)). Moreover, the multi-mixture per class EM variant refined search results more quickly with more than one order of magnitude improvement in execution time compared with TSVM. A second tool, CRFNER, uses conditional random fields (Lafferty et al. (2001) Conditional random fields: Probabilistic models for segmenting and labeling sequence data. In Proceedings of ICML-2001) to recognize 15 types of named entities from schizophrenia abstracts outperforming ABNER (Settles (2004) Biomedical named entity recognition using conditional random fields and rich feature sets. In Proceedings of COLING 2004 International Joint Workshop on Natural Language Processing in Biomedicine and its Applications (NLPBA)) in biological named entity recognition and reaching F(1) performance of 82.5% on the second set of named entities.

摘要

生物医学文献规模的不断扩大,使得更精确的信息检索以及挖掘科学文献中的隐性知识成为必要。在本章中,首先介绍了期望最大化(EM)方法用于半监督文档分类的三种新变体(《机器学习》39:103 - 134,2000年),以优化生物医学文献元搜索。使用凝聚信息瓶颈聚类(斯洛尼姆和蒂什比(1999年)凝聚信息瓶颈。发表于《神经信息处理系统大会论文集 - 12》)和戴维斯 - 布尔丁聚类有效性指标(《IEEE模式分析与机器智能汇刊》1:224 - 227,1979年)的每类多混合EM变体的检索性能,可与当前最先进的转导支持向量机(TSVM)(约阿希姆斯(1999年)使用支持向量机的文本分类转导推理。发表于《机器学习国际会议论文集》(ICML))相媲美。此外,每类多混合EM变体更快地优化了搜索结果,与TSVM相比,执行时间提高了一个多数量级。第二个工具CRFNER使用条件随机场(拉弗蒂等人(2001年)条件随机场:用于分割和标记序列数据的概率模型。发表于《ICML - 2001会议论文集》)从精神分裂症摘要中识别15种命名实体,在生物命名实体识别方面优于ABNER(塞茨(2004年)使用条件随机场和丰富特征集的生物医学命名实体识别。发表于《COLING 2004生物医学自然语言处理及其应用国际联合研讨会论文集》(NLPBA)),在第二组命名实体上达到了82.5%的F(1)性能。

相似文献

1
Knowledge discovery via machine learning for neurodegenerative disease researchers.通过机器学习为神经退行性疾病研究人员进行知识发现。
Methods Mol Biol. 2009;569:173-96. doi: 10.1007/978-1-59745-524-4_9.
2
Rich features based Conditional Random Fields for biological named entities recognition.基于丰富特征的条件随机场在生物命名实体识别中的应用
Comput Biol Med. 2007 Sep;37(9):1327-33. doi: 10.1016/j.compbiomed.2006.12.002. Epub 2007 Jan 19.
3
Building a protein name dictionary from full text: a machine learning term extraction approach.从全文构建蛋白质名称词典:一种机器学习术语提取方法。
BMC Bioinformatics. 2005 Apr 7;6:88. doi: 10.1186/1471-2105-6-88.
4
Comparison of character-level and part of speech features for name recognition in biomedical texts.生物医学文本中用于名称识别的字符级特征与词性特征比较。
J Biomed Inform. 2004 Dec;37(6):423-35. doi: 10.1016/j.jbi.2004.08.008.
5
Enhancing HMM-based biomedical named entity recognition by studying special phenomena.通过研究特殊现象增强基于隐马尔可夫模型的生物医学命名实体识别
J Biomed Inform. 2004 Dec;37(6):411-22. doi: 10.1016/j.jbi.2004.08.005.
6
Automated recognition of malignancy mentions in biomedical literature.生物医学文献中恶性肿瘤提及的自动识别。
BMC Bioinformatics. 2006 Nov 7;7:492. doi: 10.1186/1471-2105-7-492.
7
Feature selection techniques for maximum entropy based biomedical named entity recognition.基于最大熵的生物医学命名实体识别的特征选择技术。
J Biomed Inform. 2009 Oct;42(5):905-11. doi: 10.1016/j.jbi.2008.12.012. Epub 2009 Jan 23.
8
Machine learning: an indispensable tool in bioinformatics.机器学习:生物信息学中不可或缺的工具。
Methods Mol Biol. 2010;593:25-48. doi: 10.1007/978-1-60327-194-3_2.
9
BANNER: an executable survey of advances in biomedical named entity recognition.横幅:生物医学命名实体识别进展的可执行调查。
Pac Symp Biocomput. 2008:652-63.
10
Biomedical named entity recognition using two-phase model based on SVMs.基于支持向量机的两阶段模型的生物医学命名实体识别
J Biomed Inform. 2004 Dec;37(6):436-47. doi: 10.1016/j.jbi.2004.08.012.