• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

grabseqs:从多个下一代测序数据存储库中简单地下载读取和元数据。

grabseqs: simple downloading of reads and metadata from multiple next-generation sequencing data repositories.

机构信息

Department of Microbiology, Perelman School of Medicine, University of Pennsylvania.

Department of Pathology and Laboratory Medicine, Children's Hospital of Philadelphia, Philadelphia, PA 19104, USA.

出版信息

Bioinformatics. 2020 Jun 1;36(11):3607-3609. doi: 10.1093/bioinformatics/btaa167.

DOI:10.1093/bioinformatics/btaa167
PMID:32154830
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7267817/
Abstract

SUMMARY

High-throughput sequencing is a powerful technique for addressing biological questions. Grabseqs streamlines access to publicly available metagenomic data by providing a single, easy-to-use interface to download data and metadata from multiple repositories, including the Sequence Read Archive, the Metagenomics Rapid Annotation through Subsystems Technology server and iMicrobe. Users can download data and metadata in a standardized format from any number of samples or projects from a given repository with a single grabseqs command.

AVAILABILITY AND IMPLEMENTATION

Grabseqs is an open-source tool implemented in Python and licensed under the MIT license. The source code is freely available at https://github.com/louiejtaylor/grabseqs, the Python Package Index and Anaconda Cloud repository.

CONTACT

bushman@pennmedicine.upenn.edu.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

高通量测序是解决生物学问题的强大技术。Grabseqs 通过提供一个单一的、易于使用的界面,从多个存储库(包括 Sequence Read Archive、Metagenomics Rapid Annotation through Subsystems Technology 服务器和 iMicrobe)下载数据和元数据,简化了对公共宏基因组数据的访问。用户可以使用单个 grabseqs 命令从给定存储库中的任意数量的样本或项目以标准化格式下载数据和元数据。

可用性和实现

Grabseqs 是一个用 Python 实现的开源工具,根据 MIT 许可证获得许可。源代码可在以下网址免费获得:https://github.com/louiejtaylor/grabseqs、Python 包索引和 Anaconda Cloud 存储库。

联系方式

bushman@pennmedicine.upenn.edu。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
grabseqs: simple downloading of reads and metadata from multiple next-generation sequencing data repositories.grabseqs:从多个下一代测序数据存储库中简单地下载读取和元数据。
Bioinformatics. 2020 Jun 1;36(11):3607-3609. doi: 10.1093/bioinformatics/btaa167.
2
pysradb: A Python package to query next-generation sequencing metadata and data from NCBI Sequence Read Archive.pysradb:一个用于查询来自NCBI序列读取存档库的下一代测序元数据和数据的Python包。
F1000Res. 2019 Apr 23;8:532. doi: 10.12688/f1000research.18676.1. eCollection 2019.
3
Phigaro: high-throughput prophage sequence annotation.Phigaro:高通量噬菌体序列注释。
Bioinformatics. 2020 Jun 1;36(12):3882-3884. doi: 10.1093/bioinformatics/btaa250.
4
Sequencing data discovery with MetaSeek.利用 MetaSeek 进行测序数据发现。
Bioinformatics. 2019 Nov 1;35(22):4857-4859. doi: 10.1093/bioinformatics/btz499.
5
SNIKT: sequence-independent adapter identification and removal in long-read shotgun sequencing data.SNIKT:长读测序数据中序列无关接头的识别与去除。
Bioinformatics. 2022 Aug 2;38(15):3830-3832. doi: 10.1093/bioinformatics/btac389.
6
Reproducible acquisition, management and meta-analysis of nucleotide sequence (meta)data using q2-fondue.使用 q2-fondue 可重复获取、管理和元分析核苷酸序列(元)数据。
Bioinformatics. 2022 Nov 15;38(22):5081-5091. doi: 10.1093/bioinformatics/btac639.
7
Facilitating accessible, rapid, and appropriate processing of ancient metagenomic data with AMDirT.使用 AMDirT 促进古代宏基因组数据的可访问、快速和适当处理。
F1000Res. 2024 May 28;12:926. doi: 10.12688/f1000research.134798.2. eCollection 2023.
8
Simulating Illumina metagenomic data with InSilicoSeq.用 InSilicoSeq 模拟 Illumina 宏基因组数据。
Bioinformatics. 2019 Feb 1;35(3):521-522. doi: 10.1093/bioinformatics/bty630.
9
ppx: Programmatic Access to Proteomics Data Repositories.ppx:蛋白质组学数据存储库的编程访问。
J Proteome Res. 2021 Sep 3;20(9):4621-4624. doi: 10.1021/acs.jproteome.1c00454. Epub 2021 Aug 3.
10
MarineMetagenomeDB: a public repository for curated and standardized metadata for marine metagenomes.海洋宏基因组数据库:一个用于整理和标准化海洋宏基因组元数据的公共存储库。
Environ Microbiome. 2022 Nov 18;17(1):57. doi: 10.1186/s40793-022-00449-7.

引用本文的文献

1
Loop Catalog: a comprehensive HiChIP database of human and mouse samples.环状目录:一个全面的人类和小鼠样本的HiChIP数据库。
Genome Biol. 2025 Jun 20;26(1):175. doi: 10.1186/s13059-025-03615-5.
2
A computational framework for extracting biological insights from SRA cancer data.一种用于从SRA癌症数据中提取生物学见解的计算框架。
Sci Rep. 2025 Mar 8;15(1):8117. doi: 10.1038/s41598-025-91781-8.
3
Loop Catalog: a comprehensive HiChIP database of human and mouse samples.环状图谱:一个包含人类和小鼠样本的全面的HiChIP数据库。
bioRxiv. 2025 Mar 6:2024.04.26.591349. doi: 10.1101/2024.04.26.591349.
4
Investigating antimicrobial resistance genes in Kenya, Uganda and Tanzania cattle using metagenomics.利用宏基因组学研究肯尼亚、乌干达和坦桑尼亚牛中的抗菌药物耐药基因。
PeerJ. 2024 Apr 22;12:e17181. doi: 10.7717/peerj.17181. eCollection 2024.
5
GINSA: an accumulator for paired locality and next-generation small ribosomal subunit sequence data.GINSA:用于配对局部性和下一代小核糖体亚基序列数据的累加器。
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae152.
6
Edible flora in pre-Columbian Caribbean coprolites: Expected and unexpected data.史前加勒比海粪化石中的可食用植物:预期和意外的数据。
PLoS One. 2023 Oct 11;18(10):e0292077. doi: 10.1371/journal.pone.0292077. eCollection 2023.
7
Widespread, human-associated redondoviruses infect the commensal protozoan Entamoeba gingivalis.广泛存在的、与人类相关的红圆病毒感染共生原生动物牙龈阿米巴原虫。
Cell Host Microbe. 2023 Jan 11;31(1):58-68.e5. doi: 10.1016/j.chom.2022.11.002. Epub 2022 Dec 1.
8
DAnIEL: A User-Friendly Web Server for Fungal ITS Amplicon Sequencing Data.丹尼尔:一个用于真菌ITS扩增子测序数据的用户友好型网络服务器。
Front Microbiol. 2021 Aug 17;12:720513. doi: 10.3389/fmicb.2021.720513. eCollection 2021.
9
Redondovirus Diversity and Evolution on Global, Individual, and Molecular Scales.红圆病毒的多样性及其在全球、个体和分子水平上的进化。
J Virol. 2021 Oct 13;95(21):e0081721. doi: 10.1128/JVI.00817-21. Epub 2021 Aug 18.
10
Rengasvirus, a Circular Replication-Associated Protein-Encoding Single-Stranded DNA Virus-Related Genome That Is a Common Contaminant in Metagenomic Data.棱加病毒,一种与环状复制相关蛋白编码单链DNA病毒相关的基因组,是宏基因组数据中的常见污染物。
Microbiol Resour Announc. 2021 May 6;10(18):e00273-21. doi: 10.1128/MRA.00273-21.

本文引用的文献

1
Detecting contamination in viromes using ViromeQC.使用ViromeQC检测病毒宏基因组中的污染。
Nat Biotechnol. 2019 Dec;37(12):1408-1412. doi: 10.1038/s41587-019-0334-5.
2
pysradb: A Python package to query next-generation sequencing metadata and data from NCBI Sequence Read Archive.pysradb:一个用于查询来自NCBI序列读取存档库的下一代测序元数据和数据的Python包。
F1000Res. 2019 Apr 23;8:532. doi: 10.12688/f1000research.18676.1. eCollection 2019.
3
Redondoviridae, a Family of Small, Circular DNA Viruses of the Human Oro-Respiratory Tract Associated with Periodontitis and Critical Illness.红圆病毒科,一类与人的口呼吸道相关的小型环状 DNA 病毒,与牙周炎和危重病相关。
Cell Host Microbe. 2019 May 8;25(5):719-729.e4. doi: 10.1016/j.chom.2019.04.001.
4
Sunbeam: an extensible pipeline for analyzing metagenomic sequencing experiments.Sunbeam:用于分析宏基因组测序实验的可扩展流水线。
Microbiome. 2019 Mar 22;7(1):46. doi: 10.1186/s40168-019-0658-x.
5
Extensive Unexplored Human Microbiome Diversity Revealed by Over 150,000 Genomes from Metagenomes Spanning Age, Geography, and Lifestyle.从来自不同年龄、地理和生活方式的宏基因组中超过 15 万条基因组揭示了广泛未被探索的人类微生物组多样性。
Cell. 2019 Jan 24;176(3):649-662.e20. doi: 10.1016/j.cell.2019.01.001. Epub 2019 Jan 17.
6
Disruption of TET2 promotes the therapeutic efficacy of CD19-targeted T cells.TET2 缺失可增强 CD19 靶向 T 细胞的治疗效果。
Nature. 2018 Jun;558(7709):307-312. doi: 10.1038/s41586-018-0178-z. Epub 2018 May 30.
7
The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2018 update.Galaxy 平台:用于可访问、可重复和协作的生物医学分析:2018 年更新。
Nucleic Acids Res. 2018 Jul 2;46(W1):W537-W544. doi: 10.1093/nar/gky379.
8
scmap: projection of single-cell RNA-seq data across data sets.scmap:跨数据集的单细胞 RNA-seq 数据的投影。
Nat Methods. 2018 May;15(5):359-362. doi: 10.1038/nmeth.4644. Epub 2018 Apr 2.
9
An improved ATAC-seq protocol reduces background and enables interrogation of frozen tissues.一种改进的ATAC-seq方案可减少背景干扰,并能够对冷冻组织进行检测。
Nat Methods. 2017 Oct;14(10):959-962. doi: 10.1038/nmeth.4396. Epub 2017 Aug 28.
10
The International Nucleotide Sequence Database Collaboration.国际核苷酸序列数据库协作组织。
Nucleic Acids Res. 2016 Jan 4;44(D1):D48-50. doi: 10.1093/nar/gkv1323. Epub 2015 Dec 10.