• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

IGD:对大规模基因组区间数据集进行高性能搜索。

IGD: high-performance search for large-scale genomic interval datasets.

作者信息

Feng Jianglin, Sheffield Nathan C

机构信息

Center for Public Health Genomics, School of Medicine, University of Virginia, Charlottesville, VA 22903, USA.

Department of Public Health Sciences, School of Medicine, University of Virginia, Charlottesville, VA 22903, USA.

出版信息

Bioinformatics. 2021 Apr 9;37(1):118-120. doi: 10.1093/bioinformatics/btaa1062.

DOI:10.1093/bioinformatics/btaa1062
PMID:33367484
Abstract

SUMMARY

Databases of large-scale genome projects now contain thousands of genomic interval datasets. These data are a critical resource for understanding the function of DNA. However, our ability to examine and integrate interval data of this scale is limited. Here, we introduce the integrated genome database (IGD), a method and tool for searching genome interval datasets more than three orders of magnitude faster than existing approaches, while using only one hundredth of the memory. IGD uses a novel linear binning method that allows us to scale analysis to billions of genomic regions.

AVAILABILITYAND IMPLEMENTATION

https://github.com/databio/IGD.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

大规模基因组项目的数据库现在包含数千个基因组区间数据集。这些数据是理解DNA功能的关键资源。然而,我们检查和整合这种规模区间数据的能力是有限的。在这里,我们介绍了整合基因组数据库(IGD),这是一种方法和工具,用于搜索基因组区间数据集,其速度比现有方法快三个数量级以上,同时仅使用现有方法百分之一的内存。IGD使用一种新颖的线性装箱方法,使我们能够将分析扩展到数十亿个基因组区域。

可用性和实现方式

https://github.com/databio/IGD。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
IGD: high-performance search for large-scale genomic interval datasets.IGD:对大规模基因组区间数据集进行高性能搜索。
Bioinformatics. 2021 Apr 9;37(1):118-120. doi: 10.1093/bioinformatics/btaa1062.
2
Augmented Interval List: a novel data structure for efficient genomic interval search.增强型区间列表:一种用于高效基因组区间搜索的新型数据结构。
Bioinformatics. 2019 Dec 1;35(23):4907-4911. doi: 10.1093/bioinformatics/btz407.
3
GIGGLE: a search engine for large-scale integrated genome analysis.GIGGLE:一个用于大规模综合基因组分析的搜索引擎。
Nat Methods. 2018 Feb;15(2):123-126. doi: 10.1038/nmeth.4556. Epub 2018 Jan 8.
4
Binning_refiner: improving genome bins through the combination of different binning programs.Bin 精炼工具:通过结合不同的 Bin 划分程序来改进基因组 Bin 划分。
Bioinformatics. 2017 Jun 15;33(12):1873-1875. doi: 10.1093/bioinformatics/btx086.
5
CoCoNet: an efficient deep learning tool for viral metagenome binning.CoCoNet:一种用于病毒宏基因组分箱的高效深度学习工具。
Bioinformatics. 2021 Sep 29;37(18):2803-2810. doi: 10.1093/bioinformatics/btab213.
6
SOPanG: online text searching over a pan-genome.SOPanG:泛基因组上的在线文本搜索。
Bioinformatics. 2018 Dec 15;34(24):4290-4292. doi: 10.1093/bioinformatics/bty506.
7
PrecisionProDB: improving the proteomics performance for precision medicine.PrecisionProDB:提升精准医学的蛋白质组学性能
Bioinformatics. 2021 Oct 11;37(19):3361-3363. doi: 10.1093/bioinformatics/btab218.
8
Mirage 2.0: fast and memory-efficient reconstruction of gene-content evolution considering heterogeneous evolutionary patterns among gene families.幻影 2.0:考虑基因家族之间异质进化模式的快速且节省内存的基因内容进化重建。
Bioinformatics. 2022 Aug 10;38(16):4039-4041. doi: 10.1093/bioinformatics/btac433.
9
FASTRAL: improving scalability of phylogenomic analysis.FASTRAL:提升系统发育基因组学分析的可扩展性。
Bioinformatics. 2021 Aug 25;37(16):2317-2324. doi: 10.1093/bioinformatics/btab093.
10
qTeller: a tool for comparative multi-genomic gene expression analysis.qTeller:一种用于比较多基因组基因表达分析的工具。
Bioinformatics. 2021 Dec 22;38(1):236-242. doi: 10.1093/bioinformatics/btab604.

引用本文的文献

1
A comprehensive benchmark of tools for efficient genomic interval querying.用于高效基因组区间查询的工具的全面基准测试。
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf379.
2
Joint Representation Learning for Retrieval and Annotation of Genomic Interval Sets.用于基因组区间集检索和注释的联合表示学习
Bioengineering (Basel). 2024 Mar 8;11(3):263. doi: 10.3390/bioengineering11030263.
3
GenomicDistributions: fast analysis of genomic intervals with Bioconductor.基因组分布:使用 Bioconductor 快速分析基因组区间
BMC Genomics. 2022 Apr 12;23(1):299. doi: 10.1186/s12864-022-08467-y.
4
Bedshift: perturbation of genomic interval sets.床位调整:基因组区间集的扰动。
Genome Biol. 2021 Aug 20;22(1):238. doi: 10.1186/s13059-021-02440-w.