Suppr超能文献

LexExp:一个用于自动扩展含噪生物医学文本概念词典的系统。

LexExp: a system for automatically expanding concept lexicons for noisy biomedical texts.

机构信息

Department of Biomedical Informatics, School of Medicine, Emory University, Atlanta, GA 30322, USA.

出版信息

Bioinformatics. 2021 Aug 25;37(16):2499-2501. doi: 10.1093/bioinformatics/btaa995.

Abstract

SUMMARY

LexExp is an open-source, data-centric lexicon expansion system that generates spelling variants of lexical expressions in a lexicon using a phrase embedding model, lexical similarity-based natural language processing methods and a set of tunable threshold decay functions. The system is customizable, can be optimized for recall or precision and can generate variants for multi-word expressions.

AVAILABILITY AND IMPLEMENTATION

Code available at: https://bitbucket.org/asarker/lexexp; data and resources available at: https://sarkerlab.org/lexexp.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

LexExp 是一个开源的、以数据为中心的词典扩展系统,它使用短语嵌入模型、基于词汇相似度的自然语言处理方法和一组可调的阈值衰减函数,根据词典中的词汇表达式生成拼写变体。该系统具有可定制性,可以针对召回率或准确率进行优化,并且可以为多词表达式生成变体。

可用性和实现

代码可在:https://bitbucket.org/asarker/lexexp 获得;数据和资源可在:https://sarkerlab.org/lexexp 获得。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/84c4/8388038/557e825f0389/btaa995f1.jpg

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验