• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于Entrez基因的快速解析器。

Fast parsers for Entrez Gene.

作者信息

Liu Mingyi, Grigoriev Andrei

机构信息

GPC Biotech AG Fraunhoferstrasse 20, 82152 Martinsried, Germany.

出版信息

Bioinformatics. 2005 Jul 15;21(14):3189-90. doi: 10.1093/bioinformatics/bti488. Epub 2005 May 6.

DOI:10.1093/bioinformatics/bti488
PMID:15879451
Abstract

NCBI completed the transition of its main genome annotation database from Locuslink to Entrez Gene in Spring 2005. However, to this date few parsers exist for the Entrez Gene annotation file. Owing to the widespread use of Locuslink and the popularity of Perl programming language in bioinformatics, a publicly available high performance Entrez Gene parser in Perl is urgently needed. We present four such parsers that were developed using several parsing approaches (Parse::RecDescent, Parse::Yapp, Perl-byacc and Perl 5 regular expressions) and provide the first in-depth comparison of these sophisticated Perl tools. Our fastest parser processes the entire human Entrez Gene annotation file in under 12 min on one Intel Xeon 2.4 GHz CPU and can be of help to the bioinformatics community during and after the transition from Locuslink to Entrez Gene.

摘要

美国国立医学图书馆国家生物技术信息中心(NCBI)于2005年春季完成了其主要基因组注释数据库从Locuslink到Entrez Gene的转换。然而,截至目前,针对Entrez Gene注释文件的解析器却很少。由于Locuslink的广泛使用以及Perl编程语言在生物信息学中的流行,迫切需要一个公开可用的高性能Perl语言Entrez Gene解析器。我们展示了使用几种解析方法(Parse::RecDescent、Parse::Yapp、Perl-byacc和Perl 5正则表达式)开发的四个这样的解析器,并首次对这些复杂的Perl工具进行了深入比较。我们最快的解析器在一台英特尔至强2.4 GHz CPU上,不到12分钟就能处理完整个人类Entrez Gene注释文件,并且在从Locuslink过渡到Entrez Gene的过程中及之后,能够对生物信息学社区有所帮助。

相似文献

1
Fast parsers for Entrez Gene.用于Entrez基因的快速解析器。
Bioinformatics. 2005 Jul 15;21(14):3189-90. doi: 10.1093/bioinformatics/bti488. Epub 2005 May 6.
2
GeneTools--application for functional annotation and statistical hypothesis testing.基因工具——用于功能注释和统计假设检验的应用程序。
BMC Bioinformatics. 2006 Oct 24;7:470. doi: 10.1186/1471-2105-7-470.
3
Querying the public databases for sequences using complex keywords contained in the feature lines.使用特征行中包含的复杂关键词在公共数据库中查询序列。
BMC Bioinformatics. 2006 Jan 27;7:45. doi: 10.1186/1471-2105-7-45.
4
A suite of Perl modules for handling microarray data.一套用于处理微阵列数据的Perl模块。
Bioinformatics. 2008 Apr 15;24(8):1102-3. doi: 10.1093/bioinformatics/btn085. Epub 2008 Mar 18.
5
Distributed modules for text annotation and IE applied to the biomedical domain.应用于生物医学领域的文本注释和信息提取的分布式模块。
Int J Med Inform. 2006 Jun;75(6):496-500. doi: 10.1016/j.ijmedinf.2005.06.011. Epub 2005 Aug 8.
6
Protein annotation by EBIMed.通过EBIMed进行蛋白质注释。
Nat Biotechnol. 2006 Aug;24(8):902-3. doi: 10.1038/nbt0806-902.
7
ONTO-PERL: an API for supporting the development and analysis of bio-ontologies.ONTO-PERL:一种支持生物本体开发与分析的应用程序编程接口。
Bioinformatics. 2008 Mar 15;24(6):885-7. doi: 10.1093/bioinformatics/btn042. Epub 2008 Feb 1.
8
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
9
Annotation-Modules: a tool for finding significant combinations of multisource annotations for gene lists.注释模块:一种用于为基因列表寻找多源注释的显著组合的工具。
Bioinformatics. 2008 Jun 1;24(11):1386-93. doi: 10.1093/bioinformatics/btn178. Epub 2008 Apr 23.
10
Searching the NCBI databases using Entrez.使用Entrez搜索NCBI数据库。
Curr Protoc Bioinformatics. 2006 Mar;Chapter 1:Unit 1.3. doi: 10.1002/0471250953.bi0103s13.

引用本文的文献

1
Identification of minimal eukaryotic introns through GeneBase, a user-friendly tool for parsing the NCBI Gene databank.通过GeneBase(一种用于解析NCBI基因数据库的用户友好型工具)鉴定最小真核内含子。
DNA Res. 2015 Dec;22(6):495-503. doi: 10.1093/dnares/dsv028. Epub 2015 Nov 17.
2
EST Express: PHP/MySQL based automated annotation of ESTs from expression libraries.EST Express:基于PHP/MySQL的来自表达文库的ESTs自动注释。
BMC Bioinformatics. 2008 Apr 10;9:186. doi: 10.1186/1471-2105-9-186.
3
iCartiGD: the Integrated Cartilage Gene Database.
iCartiGD:整合软骨基因数据库。
BMC Genet. 2007 Feb 23;8:4. doi: 10.1186/1471-2156-8-4.