• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基因组学检测的机器可读规范

A machine-readable specification for genomics assays.

机构信息

Department of Bioengineering, University of California, Berkeley, CA, 94720, United States.

Department of Biology, School of Life Sciences, Southern University of Science and Technology, Shenzhen, 518055, China.

出版信息

Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae168.

DOI:10.1093/bioinformatics/btae168
PMID:38579259
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11009023/
Abstract

MOTIVATION

Understanding the structure of sequenced fragments from genomics libraries is essential for accurate read preprocessing. Currently, different assays and sequencing technologies require custom scripts and programs that do not leverage the common structure of sequence elements present in genomics libraries.

RESULTS

We present seqspec, a machine-readable specification for libraries produced by genomics assays that facilitates standardization of preprocessing and enables tracking and comparison of genomics assays.

AVAILABILITY AND IMPLEMENTATION

The specification and associated seqspec command line tool is available at https://www.doi.org/10.5281/zenodo.10213865.

摘要

动机

理解基因组文库中测序片段的结构对于准确的读预处理至关重要。目前,不同的检测和测序技术需要定制的脚本和程序,而这些脚本和程序无法利用基因组文库中存在的序列元素的通用结构。

结果

我们提出了 seqspec,这是一种针对基因组学检测产生的文库的机器可读规范,它促进了预处理的标准化,并能够跟踪和比较基因组学检测。

可用性和实现

规范和相关的 seqspec 命令行工具可在 https://www.doi.org/10.5281/zenodo.10213865 获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/060a/11009023/c252d3b35030/btae168f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/060a/11009023/c3b33ec2df6e/btae168f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/060a/11009023/c252d3b35030/btae168f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/060a/11009023/c3b33ec2df6e/btae168f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/060a/11009023/c252d3b35030/btae168f2.jpg

相似文献

1
A machine-readable specification for genomics assays.基因组学检测的机器可读规范
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae168.
2
A machine-readable specification for genomics assays.基因组学检测的机器可读规范。
bioRxiv. 2023 Jul 18:2023.03.17.533215. doi: 10.1101/2023.03.17.533215.
3
Universal preprocessing of single-cell genomics data.单细胞基因组学数据的通用预处理
bioRxiv. 2023 Sep 15:2023.09.14.543267. doi: 10.1101/2023.09.14.543267.
4
Refget: standardized access to reference sequences.Refget:标准化参考序列访问。
Bioinformatics. 2021 Dec 22;38(1):299-300. doi: 10.1093/bioinformatics/btab524.
5
Segway 2.0: Gaussian mixture models and minibatch training.赛格威 2.0:高斯混合模型和小批量训练。
Bioinformatics. 2018 Feb 15;34(4):669-671. doi: 10.1093/bioinformatics/btx603.
6
SCExecute: custom cell barcode-stratified analyses of scRNA-seq data.SCExecute:用于单细胞 RNA-seq 数据的自定义细胞条形码分层分析。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac768.
7
SonicParanoid2: fast, accurate, and comprehensive orthology inference with machine learning and language models.SonicParanoid2:使用机器学习和语言模型实现快速、准确、全面的直系同源推断。
Genome Biol. 2024 Jul 25;25(1):195. doi: 10.1186/s13059-024-03298-4.
8
HTSeq--a Python framework to work with high-throughput sequencing data.HTSeq——一个用于处理高通量测序数据的Python框架。
Bioinformatics. 2015 Jan 15;31(2):166-9. doi: 10.1093/bioinformatics/btu638. Epub 2014 Sep 25.
9
ADMET-AI: a machine learning ADMET platform for evaluation of large-scale chemical libraries.ADMET-AI:用于评估大规模化学文库的机器学习 ADMET 平台。
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae416.
10
Megadepth: efficient coverage quantification for BigWigs and BAMs.Megadepth:BigWigs 和 BAMs 的高效覆盖度量化。
Bioinformatics. 2021 Sep 29;37(18):3014-3016. doi: 10.1093/bioinformatics/btab152.

引用本文的文献

1
Basal cell adhesion molecule (BCAM) promotes mesothelial-to-mesenchymal transition and tumor angiogenesis through paracrine signaling.基底细胞黏附分子(BCAM)通过旁分泌信号传导促进间皮-间充质转化和肿瘤血管生成。
Cell Commun Signal. 2025 Mar 13;23(1):136. doi: 10.1186/s12964-025-02128-9.
2
Flexible parsing, interpretation, and editing of technical sequences with splitcode.使用 splitcode 灵活解析、解释和编辑技术序列。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae331.
3
Reciprocal crosstalk between Th17 and mesothelial cells promotes metastasis-associated adhesion of ovarian cancer cells.

本文引用的文献

1
Zero-mode waveguides and nanopore-based sequencing technologies accelerate single-molecule studies.零模式波导和基于纳米孔的测序技术加速了单分子研究。
Biophys Physicobiol. 2022 Aug 30;19:e190032. doi: 10.2142/biophysico.bppb-v19.0032. eCollection 2022.
2
Highly sensitive single-cell chromatin accessibility assay and transcriptome coassay with METATAC.利用 METATAC 进行高灵敏度单细胞染色质可及性分析和转录组共分析。
Proc Natl Acad Sci U S A. 2022 Oct 4;119(40):e2206450119. doi: 10.1073/pnas.2206450119. Epub 2022 Sep 26.
3
Into the multiverse: advances in single-cell multiomic profiling.
Th17 细胞与间皮细胞之间的相互作用促进卵巢癌细胞转移相关黏附。
Clin Transl Med. 2024 Apr;14(4):e1604. doi: 10.1002/ctm2.1604.
4
Best practices for the execution, analysis, and data storage of plant single-cell/nucleus transcriptomics.植物单细胞/细胞核转录组学的执行、分析和数据存储的最佳实践。
Plant Cell. 2024 Mar 29;36(4):812-828. doi: 10.1093/plcell/koae003.
5
kallisto, bustools, and kb-python for quantifying bulk, single-cell, and single-nucleus RNA-seq.用于定量分析批量、单细胞和单细胞核RNA测序的kallisto、bustools和kb-python。
bioRxiv. 2024 Jan 23:2023.11.21.568164. doi: 10.1101/2023.11.21.568164.
6
simpleaf: a simple, flexible, and scalable framework for single-cell data processing using alevin-fry.simpleaf:一个使用 alevin-fry 进行单细胞数据处理的简单、灵活和可扩展的框架。
Bioinformatics. 2023 Oct 3;39(10). doi: 10.1093/bioinformatics/btad614.
7
Universal preprocessing of single-cell genomics data.单细胞基因组学数据的通用预处理
bioRxiv. 2023 Sep 15:2023.09.14.543267. doi: 10.1101/2023.09.14.543267.
8
simpleaf: A simple, flexible, and scalable framework for single-cell transcriptomics data processing using alevin-fry.simpleaf:一个使用alevin-fry进行单细胞转录组学数据处理的简单、灵活且可扩展的框架。
bioRxiv. 2023 Mar 29:2023.03.28.534653. doi: 10.1101/2023.03.28.534653.
9
Flexible parsing, interpretation, and editing of technical sequences with splitcode.使用分割码对技术序列进行灵活解析、解释和编辑。
bioRxiv. 2023 Dec 9:2023.03.20.533521. doi: 10.1101/2023.03.20.533521.
走进多元宇宙:单细胞多组学分析的进展
Trends Genet. 2022 Aug;38(8):831-843. doi: 10.1016/j.tig.2022.03.015. Epub 2022 May 8.
4
Alevin-fry unlocks rapid, accurate and memory-frugal quantification of single-cell RNA-seq data.Alevin-fry实现了对单细胞RNA测序数据的快速、准确且节省内存的定量分析。
Nat Methods. 2022 Mar;19(3):316-322. doi: 10.1038/s41592-022-01408-3. Epub 2022 Mar 11.
5
Single-cell Iso-Sequencing enables rapid genome annotation for scRNAseq analysis.单细胞同重测序可实现 scRNAseq 分析的快速基因组注释。
Genetics. 2022 Mar 3;220(3). doi: 10.1093/genetics/iyac017.
6
The Sequence Read Archive: a decade more of explosive growth.序列读取档案:十年的爆炸式增长。
Nucleic Acids Res. 2022 Jan 7;50(D1):D387-D390. doi: 10.1093/nar/gkab1053.
7
Modular, efficient and constant-memory single-cell RNA-seq preprocessing.模块化、高效且内存恒定的单细胞RNA测序预处理
Nat Biotechnol. 2021 Jul;39(7):813-818. doi: 10.1038/s41587-021-00870-2. Epub 2021 Apr 1.
8
Chromatin Potential Identified by Shared Single-Cell Profiling of RNA and Chromatin.基于 RNA 和染色质的共享单细胞分析鉴定染色质潜能
Cell. 2020 Nov 12;183(4):1103-1116.e20. doi: 10.1016/j.cell.2020.09.056. Epub 2020 Oct 23.
9
Joint profiling of chromatin accessibility and gene expression in thousands of single cells.在数千个单细胞中进行染色质可及性和基因表达的联合分析。
Science. 2018 Sep 28;361(6409):1380-1385. doi: 10.1126/science.aau0730. Epub 2018 Aug 30.
10
Exploring the single-cell RNA-seq analysis landscape with the scRNA-tools database.探索单细胞 RNA-seq 分析图谱与 scRNA-tools 数据库。
PLoS Comput Biol. 2018 Jun 25;14(6):e1006245. doi: 10.1371/journal.pcbi.1006245. eCollection 2018 Jun.