• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 slow5curl 简化远程 nanopore 数据访问。

Streamlining remote nanopore data access with slow5curl.

机构信息

Genomics and Inherited Disease Program, Garvan Institute of Medical Research, Sydney, NSW 2010, Australia.

Centre for Population Genomics, Garvan Institute of Medical Research and Murdoch Children's Research Institute,Sydney, NSW 2010, Australia.

出版信息

Gigascience. 2024 Jan 2;13. doi: 10.1093/gigascience/giae016.

DOI:10.1093/gigascience/giae016
PMID:38608279
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11010652/
Abstract

BACKGROUND

As adoption of nanopore sequencing technology continues to advance, the need to maintain large volumes of raw current signal data for reanalysis with updated algorithms is a growing challenge. Here we introduce slow5curl, a software package designed to streamline nanopore data sharing, accessibility, and reanalysis.

RESULTS

Slow5curl allows a user to fetch a specified read or group of reads from a raw nanopore dataset stored on a remote server, such as a public data repository, without downloading the entire file. Slow5curl uses an index to quickly fetch specific reads from a large dataset in SLOW5/BLOW5 format and highly parallelized data access requests to maximize download speeds. Using all public nanopore data from the Human Pangenome Reference Consortium (>22 TB), we demonstrate how slow5curl can be used to quickly fetch and reanalyze raw signal reads corresponding to a set of target genes from each individual in large cohort dataset (n = 91), minimizing the time, egress costs, and local storage requirements for their reanalysis.

CONCLUSIONS

We provide slow5curl as a free, open-source package that will reduce frictions in data sharing for the nanopore community: https://github.com/BonsonW/slow5curl.

摘要

背景

随着纳米孔测序技术的不断发展,需要不断更新算法来维护大量原始电流信号数据以供重新分析,这是一个日益严峻的挑战。本文介绍了 slow5curl,这是一个软件包,旨在简化纳米孔数据共享、可访问性和重新分析。

结果

slow5curl 允许用户从存储在远程服务器(如公共数据存储库)上的原始纳米孔数据集获取指定的读取或一组读取,而无需下载整个文件。slow5curl 使用索引来快速从 SLOW5/BLOW5 格式的大型数据集获取特定读取,并使用高度并行化的数据访问请求来最大限度地提高下载速度。使用人类泛基因组参考联盟的所有公共纳米孔数据(>22 TB),我们展示了如何使用 slow5curl 从大型队列数据集(n=91)中每个个体的一组目标基因中快速获取和重新分析原始信号读取,从而最大限度地减少重新分析的时间、出口成本和本地存储需求。

结论

我们提供了免费的开源软件包 slow5curl,以减少纳米孔社区的数据共享障碍:https://github.com/BonsonW/slow5curl。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47f1/11010652/2050153d1e6d/giae016fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47f1/11010652/2050153d1e6d/giae016fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/47f1/11010652/2050153d1e6d/giae016fig1.jpg

相似文献

1
Streamlining remote nanopore data access with slow5curl.使用 slow5curl 简化远程 nanopore 数据访问。
Gigascience. 2024 Jan 2;13. doi: 10.1093/gigascience/giae016.
2
Accelerated nanopore basecalling with SLOW5 data format.基于 SLOW5 数据格式的快速纳米孔碱基调用。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad352.
3
Flexible and efficient handling of nanopore sequencing signal data with slow5tools.使用 slow5tools 灵活高效地处理纳米孔测序信号数据。
Genome Biol. 2023 Apr 6;24(1):69. doi: 10.1186/s13059-023-02910-3.
4
RawHash2: mapping raw nanopore signals using hash-based seeding and adaptive quantization.RawHash2:基于哈希的种子生成和自适应量化的原始纳米孔信号映射。
Bioinformatics. 2024 Aug 2;40(8). doi: 10.1093/bioinformatics/btae478.
5
SquiggleKit: a toolkit for manipulating nanopore signal data.SquiggleKit:用于处理纳米孔信号数据的工具包。
Bioinformatics. 2019 Dec 15;35(24):5372-5373. doi: 10.1093/bioinformatics/btz586.
6
Sigmoni: classification of nanopore signal with a compressed pangenome index.西格蒙尼:使用压缩泛基因组索引对纳米孔信号进行分类。
Bioinformatics. 2024 Jun 28;40(Suppl 1):i287-i296. doi: 10.1093/bioinformatics/btae213.
7
Penguin: A tool for predicting pseudouridine sites in direct RNA nanopore sequencing data.Penguin:一种用于预测直接 RNA 纳米孔测序数据中假尿嘧啶位点的工具。
Methods. 2022 Jul;203:478-487. doi: 10.1016/j.ymeth.2022.02.005. Epub 2022 Feb 16.
8
Reference-free lossless compression of nanopore sequencing reads using an approximate assembly approach.使用近似组装方法对纳米孔测序读取进行无参考无损压缩。
Sci Rep. 2023 Feb 6;13(1):2082. doi: 10.1038/s41598-023-29267-8.
9
Simulation of nanopore sequencing signal data with tunable parameters.可调参数的纳米孔测序信号数据模拟。
Genome Res. 2024 Jun 25;34(5):778-783. doi: 10.1101/gr.278730.123.
10
ENANO: Encoder for NANOpore FASTQ files.ENANO:用于 Nanopore FASTQ 文件的编码器。
Bioinformatics. 2020 Aug 15;36(16):4506-4507. doi: 10.1093/bioinformatics/btaa551.

引用本文的文献

1
A new compression strategy to reduce the size of nanopore sequencing data.一种用于减小纳米孔测序数据大小的新压缩策略。
Genome Res. 2025 Jul 1;35(7):1574-1582. doi: 10.1101/gr.280090.124.

本文引用的文献

1
Interactive visualization of nanopore sequencing signal data with Squigualiser.使用 Squigualiser 对纳米孔测序信号数据进行交互式可视化。
Bioinformatics. 2024 Aug 2;40(8). doi: 10.1093/bioinformatics/btae501.
2
Simulation of nanopore sequencing signal data with tunable parameters.可调参数的纳米孔测序信号数据模拟。
Genome Res. 2024 Jun 25;34(5):778-783. doi: 10.1101/gr.278730.123.
3
Benchmarking of computational methods for m6A profiling with Nanopore direct RNA sequencing.使用纳米孔直接RNA测序进行m6A分析的计算方法基准测试。
Brief Bioinform. 2024 Jan 22;25(2). doi: 10.1093/bib/bbae001.
4
Scalable Nanopore sequencing of human genomes provides a comprehensive view of haplotype-resolved variation and methylation.可扩展的纳米孔测序技术对人类基因组进行测序,提供了全面的单倍型分辨率变异和甲基化视图。
Nat Methods. 2023 Oct;20(10):1483-1492. doi: 10.1038/s41592-023-01993-x. Epub 2023 Sep 14.
5
Efficient real-time selective genome sequencing on resource-constrained devices.在资源受限的设备上进行高效实时的选择性基因组测序。
Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad046. Epub 2023 Jul 3.
6
Accelerated nanopore basecalling with SLOW5 data format.基于 SLOW5 数据格式的快速纳米孔碱基调用。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad352.
7
A draft human pangenome reference.人类泛基因组参考草图。
Nature. 2023 May;617(7960):312-324. doi: 10.1038/s41586-023-05896-x. Epub 2023 May 10.
8
Flexible and efficient handling of nanopore sequencing signal data with slow5tools.使用 slow5tools 灵活高效地处理纳米孔测序信号数据。
Genome Biol. 2023 Apr 6;24(1):69. doi: 10.1186/s13059-023-02910-3.
9
DeepSelectNet: deep neural network based selective sequencing for oxford nanopore sequencing.DeepSelectNet:基于深度神经网络的牛津纳米孔测序选择性测序。
BMC Bioinformatics. 2023 Jan 28;24(1):31. doi: 10.1186/s12859-023-05151-0.
10
Method of the year: long-read sequencing.年度方法:长读长测序。
Nat Methods. 2023 Jan;20(1):6-11. doi: 10.1038/s41592-022-01730-w.