• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
Using the PubAnnotation ecosystem to perform agile text mining on Genomics & Informatics: a tutorial review.利用PubAnnotation生态系统对基因组学与信息学进行敏捷文本挖掘:教程综述
Genomics Inform. 2020 Jun;18(2):e13. doi: 10.5808/GI.2020.18.2.e13. Epub 2020 Jun 16.
2
Open Agile text mining for bioinformatics: the PubAnnotation ecosystem.开放的生物信息学敏捷文本挖掘:PubAnnotation 生态系统。
Bioinformatics. 2019 Nov 1;35(21):4372-4380. doi: 10.1093/bioinformatics/btz227.
3
Extending TextAE for annotation of non-contiguous entities.扩展TextAE用于非连续实体的标注。
Genomics Inform. 2020 Jun;18(2):e15. doi: 10.5808/GI.2020.18.2.e15. Epub 2020 Jun 15.
4
Auto-CORPus: A Natural Language Processing Tool for Standardizing and Reusing Biomedical Literature.自动语料库:一种用于规范和复用生物医学文献的自然语言处理工具。
Front Digit Health. 2022 Feb 15;4:788124. doi: 10.3389/fdgth.2022.788124. eCollection 2022.
5
Integration of the PubAnnotation ecosystem in the development of a web-based search tool for alternative methods.在开发基于网络的替代方法搜索工具时整合PubAnnotation生态系统。
Genomics Inform. 2020 Jun;18(2):e18. doi: 10.5808/GI.2020.18.2.e18. Epub 2020 Jun 15.
6
Organizing an in-class hackathon to correct PDF-to-text conversion errors of Genomics & Informatics 1.0.组织一场课堂内的黑客马拉松活动,以纠正《基因组学与信息学1.0》中PDF到文本转换的错误。
Genomics Inform. 2020 Sep;18(3):e33. doi: 10.5808/GI.2020.18.3.e33. Epub 2020 Sep 17.
7
Opinion: Strategy of Semi-Automatically Annotating Full Text Corpus of Genomics & Informatics.观点:基因组学与信息学全文语料库半自动标注策略。
Genomics Inform. 2018 Dec;16(4):e40. doi: 10.5808/GI.2018.16.4.e40. Epub 2018 Dec 28.
8
OryzaGP: rice gene and protein dataset for named-entity recognition.OryzaGP:用于命名实体识别的水稻基因和蛋白质数据集。
Genomics Inform. 2019 Jun;17(2):e17. doi: 10.5808/GI.2019.17.2.e17. Epub 2019 Jun 26.
9
PubMedPortable: A Framework for Supporting the Development of Text Mining Applications.PubMed便携式:支持文本挖掘应用开发的框架。
PLoS One. 2016 Oct 5;11(10):e0163794. doi: 10.1371/journal.pone.0163794. eCollection 2016.
10
GNI Corpus Version 1.0: Annotated Full-Text Corpus of Genomics & Informatics to Support Biomedical Information Extraction.国民总收入语料库版本1.0:用于支持生物医学信息提取的基因组学与信息学注释全文语料库。
Genomics Inform. 2018 Sep;16(3):75-77. doi: 10.5808/GI.2018.16.3.75. Epub 2018 Sep 30.

引用本文的文献

1
Functional implications of glycans and their curation: insights from the workshop held at the 16th Annual International Biocuration Conference in Padua, Italy.聚糖的功能意义及其整理:在意大利帕多瓦举行的第 16 届国际生物整理会议研讨会上获得的认识。
Database (Oxford). 2024 Aug 13;2024. doi: 10.1093/database/baae073.
2
Estimation of the journal distance of Genomics & Informatics from other bioinformatics-driven journals, 2003-2018.2003年至2018年期间《基因组学与信息学》与其他生物信息学驱动期刊的期刊距离估计。
Genomics Inform. 2021 Dec;19(4):e51. doi: 10.5808/gi.21074. Epub 2021 Dec 31.

本文引用的文献

1
Open Agile text mining for bioinformatics: the PubAnnotation ecosystem.开放的生物信息学敏捷文本挖掘:PubAnnotation 生态系统。
Bioinformatics. 2019 Nov 1;35(21):4372-4380. doi: 10.1093/bioinformatics/btz227.
2
Comparison of named entity recognition methodologies in biomedical documents.生物医学文献中命名实体识别方法的比较。
Biomed Eng Online. 2018 Nov 6;17(Suppl 2):158. doi: 10.1186/s12938-018-0573-6.
3
GNI Corpus Version 1.0: Annotated Full-Text Corpus of Genomics & Informatics to Support Biomedical Information Extraction.国民总收入语料库版本1.0:用于支持生物医学信息提取的基因组学与信息学注释全文语料库。
Genomics Inform. 2018 Sep;16(3):75-77. doi: 10.5808/GI.2018.16.3.75. Epub 2018 Sep 30.

利用PubAnnotation生态系统对基因组学与信息学进行敏捷文本挖掘:教程综述

Using the PubAnnotation ecosystem to perform agile text mining on Genomics & Informatics: a tutorial review.

作者信息

Nam Hee-Jo, Yamada Ryota, Park Hyun-Seok

机构信息

Bioinformatics Laboratory, ELTEC College of Engineering, Ewha Womans University, Seoul 03760, Korea.

Fuku Corporation, Tokyo 113-0033, Japan.

出版信息

Genomics Inform. 2020 Jun;18(2):e13. doi: 10.5808/GI.2020.18.2.e13. Epub 2020 Jun 16.

DOI:10.5808/GI.2020.18.2.e13
PMID:32634867
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7362947/
Abstract

The prototype version of the full-text corpus of Genomics & Informatics has recently been archived in a GitHub repository. The full-text publications of volumes 10 through 17 are also directly downloadable from PubMed Central (PMC) as XML files. During the Biomedical Linked Annotation Hackathon 6 (BLAH6), we experimented with converting, annotating, and updating 301 PMC full-text articles of Genomics & Informatics using PubAnnotation, a system that provides a convenient way to add PMC publications based on PMCID. Thus, this review aims to provide a tutorial overview of practicing the iterative task of named entity recognition with the PubAnnotation/PubDictionaries/TextAE ecosystem. We also describe developing a conversion tool between the Genia tagger output and the JSON format of PubAnnotation during the hackathon.

摘要

《基因组学与信息学》全文语料库的原型版本最近已存档于GitHub仓库。第10卷至第17卷的全文出版物也可直接从PubMed Central(PMC)以XML文件形式下载。在生物医学链接注释黑客马拉松6(BLAH6)期间,我们尝试使用PubAnnotation对《基因组学与信息学》的301篇PMC全文文章进行转换、注释和更新,PubAnnotation是一个基于PMCID添加PMC出版物的便捷系统。因此,本综述旨在提供一个教程概述,介绍如何使用PubAnnotation/PubDictionaries/TextAE生态系统执行命名实体识别的迭代任务。我们还描述了在黑客马拉松期间开发Genia标记器输出与PubAnnotation的JSON格式之间的转换工具。