• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用嵌套包含列表从关系型数据库系统中快速存储和检索基因组区间。

Rapid storage and retrieval of genomic intervals from a relational database system using nested containment lists.

机构信息

Department of Biomedical Informatics, Center for Human Genetics Research, Vanderbilt University, 2215 Garland Ave, Nashville, TN 37232, USA.

出版信息

Database (Oxford). 2013 Jul 26;2013:bat056. doi: 10.1093/database/bat056. Print 2013.

DOI:10.1093/database/bat056
PMID:23894185
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3724366/
Abstract

Efficient storage and retrieval of genomic annotations based on range intervals is necessary, given the amount of data produced by next-generation sequencing studies. The indexing strategies of relational database systems (such as MySQL) greatly inhibit their use in genomic annotation tasks. This has led to the development of stand-alone applications that are dependent on flat-file libraries. In this work, we introduce MyNCList, an implementation of the NCList data structure within a MySQL database. MyNCList enables the storage, update and rapid retrieval of genomic annotations from the convenience of a relational database system. Range-based annotations of 1 million variants are retrieved in under a minute, making this approach feasible for whole-genome annotation tasks. Database URL: https://github.com/bushlab/mynclist.

摘要

基于范围区间的高效存储和检索基因组注释是必要的,因为下一代测序研究产生的数据量非常大。关系型数据库系统(如 MySQL)的索引策略极大地限制了它们在基因组注释任务中的使用。这导致了独立应用程序的开发,这些应用程序依赖于平面文件库。在这项工作中,我们引入了 MyNCList,这是 MySQL 数据库中 NCList 数据结构的实现。MyNCList 使从关系型数据库系统的便利性中存储、更新和快速检索基因组注释成为可能。在不到一分钟的时间内检索到 100 万个变体的基于范围的注释,这使得这种方法对于全基因组注释任务是可行的。数据库 URL:https://github.com/bushlab/mynclist。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/1bb0c49a5504/bat056f3p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/51ba98c551dd/bat056f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/f06b3e9981f6/bat056f2p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/1bb0c49a5504/bat056f3p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/51ba98c551dd/bat056f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/f06b3e9981f6/bat056f2p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/bdff/3724366/1bb0c49a5504/bat056f3p.jpg

相似文献

1
Rapid storage and retrieval of genomic intervals from a relational database system using nested containment lists.使用嵌套包含列表从关系型数据库系统中快速存储和检索基因组区间。
Database (Oxford). 2013 Jul 26;2013:bat056. doi: 10.1093/database/bat056. Print 2013.
2
Evaluation of relational and NoSQL database architectures to manage genomic annotations.用于管理基因组注释的关系型和非关系型数据库架构评估。
J Biomed Inform. 2016 Dec;64:288-295. doi: 10.1016/j.jbi.2016.10.015. Epub 2016 Oct 31.
3
Nested Containment List (NCList): a new algorithm for accelerating interval query of genome alignment and interval databases.嵌套包含列表(NCList):一种加速基因组比对和区间数据库区间查询的新算法。
Bioinformatics. 2007 Jun 1;23(11):1386-93. doi: 10.1093/bioinformatics/btl647. Epub 2007 Jan 18.
4
Elsevier's approach to the bioCADDIE 2016 Dataset Retrieval Challenge.爱思唯尔应对生物CADDIE 2016数据集检索挑战赛的方法。
Database (Oxford). 2017 Jan 1;2017. doi: 10.1093/database/bax056.
5
Neo4j graph database realizes efficient storage performance of oilfield ontology.Neo4j 图数据库实现了油田本体的高效存储性能。
PLoS One. 2018 Nov 16;13(11):e0207595. doi: 10.1371/journal.pone.0207595. eCollection 2018.
6
The UCSC Genome Browser Database.加州大学圣克鲁兹分校基因组浏览器数据库。
Nucleic Acids Res. 2003 Jan 1;31(1):51-4. doi: 10.1093/nar/gkg129.
7
Ontology annotation treebrowser : an interactive tool where the complementarity of medical subject headings and gene ontology improves the interpretation of gene lists.本体注释树浏览器:一种交互式工具,其中医学主题词表和基因本体的互补性提高了基因列表的解读。
Appl Bioinformatics. 2006;5(4):225-36. doi: 10.2165/00822942-200605040-00005.
8
Damming the genomic data flood using a comprehensive analysis and storage data structure.利用综合分析和存储数据结构来遏制基因组数据洪流。
Database (Oxford). 2010 Dec 15;2010:baq029. doi: 10.1093/database/baq029. Print 2010.
9
GeneRecords: a relational database for GenBank flat file parsing and data manipulation in personal computers.基因记录:用于在个人计算机中解析GenBank扁平文件和进行数据操作的关系数据库。
Bioinformatics. 2004 Nov 1;20(16):2883-5. doi: 10.1093/bioinformatics/bth321. Epub 2004 May 14.
10
annot8r: GO, EC and KEGG annotation of EST datasets.annot8r:EST数据集的基因本体论(GO)、酶委员会编号(EC)和京都基因与基因组百科全书(KEGG)注释
BMC Bioinformatics. 2008 Apr 9;9:180. doi: 10.1186/1471-2105-9-180.

引用本文的文献

1
Efficient Genomic Interval Queries Using Augmented Range Trees.基于增强型范围树的高效基因组区间查询。
Sci Rep. 2019 Mar 25;9(1):5059. doi: 10.1038/s41598-019-41451-3.

本文引用的文献

1
PeakAnalyzer: genome-wide annotation of chromatin binding and modification loci.PeakAnalyzer:全基因组注释染色质结合和修饰基因座。
BMC Bioinformatics. 2010 Aug 6;11:415. doi: 10.1186/1471-2105-11-415.
2
ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data.ANNOVAR:从高通量测序数据中注释遗传变异的功能。
Nucleic Acids Res. 2010 Sep;38(16):e164. doi: 10.1093/nar/gkq603. Epub 2010 Jul 3.
3
Predicting functional alternative splicing by measuring RNA selection pressure from multigenome alignments.
基于多基因组比对来衡量 RNA 选择压力预测功能选择性剪接。
PLoS Comput Biol. 2009 Dec;5(12):e1000608. doi: 10.1371/journal.pcbi.1000608. Epub 2009 Dec 18.
4
JBrowse: a next-generation genome browser.JBrowse:新一代基因组浏览器。
Genome Res. 2009 Sep;19(9):1630-8. doi: 10.1101/gr.094607.109. Epub 2009 Jul 1.
5
Diverse splicing patterns of exonized Alu elements in human tissues.人类组织中外显子化Alu元件的多种剪接模式。
PLoS Genet. 2008 Oct 17;4(10):e1000225. doi: 10.1371/journal.pgen.1000225.
6
Nested Containment List (NCList): a new algorithm for accelerating interval query of genome alignment and interval databases.嵌套包含列表(NCList):一种加速基因组比对和区间数据库区间查询的新算法。
Bioinformatics. 2007 Jun 1;23(11):1386-93. doi: 10.1093/bioinformatics/btl647. Epub 2007 Jan 18.