• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

单细胞基因组学数据的通用预处理

Universal preprocessing of single-cell genomics data.

作者信息

Booeshaghi A Sina, Sullivan Delaney K, Pachter Lior

机构信息

Division of Biology and Biological Engineering, California Institute of Technology, Pasadena, CA, USA.

UCLA-Caltech Medical Scientist Training Program, David Geffen School of Medicine, University of California, Los Angeles, Los Angeles, CA, USA.

出版信息

bioRxiv. 2023 Sep 15:2023.09.14.543267. doi: 10.1101/2023.09.14.543267.

DOI:10.1101/2023.09.14.543267
PMID:37745572
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10515959/
Abstract

We describe a workflow for preprocessing a wide variety of single-cell genomics data types. The approach is based on parsing of machine-readable assay specifications to customize inputs for , which uses and to catalog reads, error correct barcodes, and count reads. The universal preprocessing method is implemented in the Python package that is available for download at: https://github.com/cellatlas/cellatlas/.

摘要

我们描述了一种用于预处理各种单细胞基因组学数据类型的工作流程。该方法基于对机器可读检测规范的解析,以为[具体工具名称]定制输入,[具体工具名称]使用[工具1名称]和[工具2名称]对 reads 进行编目、纠错条形码并计数 reads。通用预处理方法在 Python 包[包名称]中实现,可从以下网址下载:https://github.com/cellatlas/cellatlas/ 。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/1180ce9f342b/nihpp-2023.09.14.543267v1-f0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/0322e892c0aa/nihpp-2023.09.14.543267v1-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/2985a07debee/nihpp-2023.09.14.543267v1-f0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/1180ce9f342b/nihpp-2023.09.14.543267v1-f0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/0322e892c0aa/nihpp-2023.09.14.543267v1-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/2985a07debee/nihpp-2023.09.14.543267v1-f0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5b5a/10515959/1180ce9f342b/nihpp-2023.09.14.543267v1-f0003.jpg

相似文献

1
Universal preprocessing of single-cell genomics data.单细胞基因组学数据的通用预处理
bioRxiv. 2023 Sep 15:2023.09.14.543267. doi: 10.1101/2023.09.14.543267.
2
A machine-readable specification for genomics assays.基因组学检测的机器可读规范。
bioRxiv. 2023 Jul 18:2023.03.17.533215. doi: 10.1101/2023.03.17.533215.
3
kallisto, bustools, and kb-python for quantifying bulk, single-cell, and single-nucleus RNA-seq.用于定量分析批量、单细胞和单细胞核RNA测序的kallisto、bustools和kb-python。
bioRxiv. 2024 Jan 23:2023.11.21.568164. doi: 10.1101/2023.11.21.568164.
4
kallisto, bustools and kb-python for quantifying bulk, single-cell and single-nucleus RNA-seq.用于定量分析批量、单细胞和单细胞核RNA测序的kallisto、bustools和kb-python。
Nat Protoc. 2025 Mar;20(3):587-607. doi: 10.1038/s41596-024-01057-0. Epub 2024 Oct 10.
5
A machine-readable specification for genomics assays.基因组学检测的机器可读规范
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae168.
6
Benchmarking UMI-based single-cell RNA-seq preprocessing workflows.基于 UMIs 的单细胞 RNA-seq 预处理工作流程的基准测试。
Genome Biol. 2021 Dec 14;22(1):339. doi: 10.1186/s13059-021-02552-3.
7
Analysing high-throughput sequencing data in Python with HTSeq 2.0.用 HTSeq 2.0 分析 Python 中的高通量测序数据。
Bioinformatics. 2022 May 13;38(10):2943-2945. doi: 10.1093/bioinformatics/btac166.
8
SCSit: A high-efficiency preprocessing tool for single-cell sequencing data from SPLiT-seq.SCSit:一种用于来自SPLiT-seq的单细胞测序数据的高效预处理工具。
Comput Struct Biotechnol J. 2021 Aug 14;19:4574-4580. doi: 10.1016/j.csbj.2021.08.021. eCollection 2021.
9
UMIc: A Preprocessing Method for UMI Deduplication and Reads Correction.UMIc:一种用于UMI去重和读段校正的预处理方法。
Front Genet. 2021 May 28;12:660366. doi: 10.3389/fgene.2021.660366. eCollection 2021.
10
JBrowse Jupyter: a Python interface to JBrowse 2.JBrowse Jupyter:JBrowse 2 的 Python 接口。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad032.

本文引用的文献

1
A machine-readable specification for genomics assays.基因组学检测的机器可读规范
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae168.
2
Quantifying orthogonal barcodes for sequence census assays.用于序列普查分析的正交条形码定量
Bioinform Adv. 2023 Dec 20;4(1):vbad181. doi: 10.1093/bioadv/vbad181. eCollection 2024.
3
Metadata retrieval from sequence databases with ffq.利用 ffq 从序列数据库中检索元数据。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac667.
4
A flexible cross-platform single-cell data processing pipeline.一个灵活的跨平台单细胞数据处理管道。
Nat Commun. 2022 Nov 11;13(1):6847. doi: 10.1038/s41467-022-34681-z.
5
ISSAAC-seq enables sensitive and flexible multimodal profiling of chromatin accessibility and gene expression in single cells.ISSAAC-seq 能够灵敏且灵活地对单细胞中的染色质可及性和基因表达进行多模式分析。
Nat Methods. 2022 Oct;19(10):1243-1249. doi: 10.1038/s41592-022-01601-4. Epub 2022 Sep 15.
6
Comprehensive benchmarking of CITE-seq versus DOGMA-seq single cell multimodal omics.CITE-seq 与 DOGMA-seq 单细胞多模态组学的综合基准测试。
Genome Biol. 2022 Jun 23;23(1):135. doi: 10.1186/s13059-022-02698-8.
7
Alevin-fry unlocks rapid, accurate and memory-frugal quantification of single-cell RNA-seq data.Alevin-fry实现了对单细胞RNA测序数据的快速、准确且节省内存的定量分析。
Nat Methods. 2022 Mar;19(3):316-322. doi: 10.1038/s41592-022-01408-3. Epub 2022 Mar 11.
8
Isoform cell-type specificity in the mouse primary motor cortex.小鼠初级运动皮层中的同工型细胞类型特异性。
Nature. 2021 Oct;598(7879):195-199. doi: 10.1038/s41586-021-03969-3. Epub 2021 Oct 6.
9
Scalable, multimodal profiling of chromatin accessibility, gene expression and protein levels in single cells.可扩展的、多模式的单细胞染色质可及性、基因表达和蛋白水平的分析。
Nat Biotechnol. 2021 Oct;39(10):1246-1258. doi: 10.1038/s41587-021-00927-2. Epub 2021 Jun 3.
10
Modular, efficient and constant-memory single-cell RNA-seq preprocessing.模块化、高效且内存恒定的单细胞RNA测序预处理
Nat Biotechnol. 2021 Jul;39(7):813-818. doi: 10.1038/s41587-021-00870-2. Epub 2021 Apr 1.