• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

创始人重建可实现可扩展的无缝泛基因组分析。

Founder reconstruction enables scalable and seamless pangenomic analysis.

机构信息

Department of Computer Science, University of Helsinki, Helsinki 00014, Finland.

出版信息

Bioinformatics. 2021 Dec 11;37(24):4611-4619. doi: 10.1093/bioinformatics/btab516.

DOI:10.1093/bioinformatics/btab516
PMID:34260702
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8665761/
Abstract

MOTIVATION

Variant calling workflows that utilize a single reference sequence are the de facto standard elementary genomic analysis routine for resequencing projects. Various ways to enhance the reference with pangenomic information have been proposed, but scalability combined with seamless integration to existing workflows remains a challenge.

RESULTS

We present PanVC with founder sequences, a scalable and accurate variant calling workflow based on a multiple alignment of reference sequences. Scalability is achieved by removing duplicate parts up to a limit into a founder multiple alignment, that is then indexed using a hybrid scheme that exploits general purpose read aligners. Our implemented workflow uses GATK or BCFtools for variant calling, but the various steps of our workflow (e.g. vcf2multialign tool, founder reconstruction) can be of independent interest as a basis for creating novel pangenome analysis workflows beyond variant calling.

AVAILABILITY AND IMPLEMENTATION

Our open access tools and instructions how to reproduce our experiments are available at the following address: https://github.com/algbio/panvc-founders.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

利用单一参考序列的变异调用工作流程是重测序项目基本的标准基因组分析常规。已经提出了各种利用泛基因组信息增强参考序列的方法,但可扩展性以及与现有工作流程的无缝集成仍然是一个挑战。

结果

我们提出了 PanVC 与创始序列,这是一种基于参考序列多重比对的可扩展且准确的变异调用工作流程。可扩展性是通过将重复部分最多去除到创始多重比对的限制内来实现的,然后使用利用通用读取比对器的混合方案对其进行索引。我们实现的工作流程使用 GATK 或 BCFtools 进行变异调用,但我们工作流程的各个步骤(例如 vcf2multialign 工具、创始重建)可以作为创建超越变异调用的新型泛基因组分析工作流程的基础,具有独立的意义。

可用性和实现

我们的开放访问工具以及重现我们实验的说明可在以下地址获得:https://github.com/algbio/panvc-founders。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/edfcb10db7a5/btab516f9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/6770542377ee/btab516f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/13fe58f44096/btab516f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/b1b43a62e92c/btab516f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/b344669c2a60/btab516f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/0fe546c52b21/btab516f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/375e471d3701/btab516f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/1a787b1bccd1/btab516f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/49c82e058119/btab516f8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/edfcb10db7a5/btab516f9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/6770542377ee/btab516f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/13fe58f44096/btab516f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/b1b43a62e92c/btab516f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/b344669c2a60/btab516f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/0fe546c52b21/btab516f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/375e471d3701/btab516f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/1a787b1bccd1/btab516f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/49c82e058119/btab516f8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8796/8665761/edfcb10db7a5/btab516f9.jpg

相似文献

1
Founder reconstruction enables scalable and seamless pangenomic analysis.创始人重建可实现可扩展的无缝泛基因组分析。
Bioinformatics. 2021 Dec 11;37(24):4611-4619. doi: 10.1093/bioinformatics/btab516.
2
Towards pan-genome read alignment to improve variation calling.迈向泛基因组读对齐以改善变异调用。
BMC Genomics. 2018 May 9;19(Suppl 2):87. doi: 10.1186/s12864-018-4465-8.
3
Tackling reference bias in genotyping by using founder sequences with PanVC 3.使用PanVC 3的奠基者序列解决基因分型中的参考偏差问题。
Bioinform Adv. 2024 Mar 4;4(1):vbae027. doi: 10.1093/bioadv/vbae027. eCollection 2024.
4
Managing genomic variant calling workflows with Swift/T.使用 Swift/T 管理基因组变异调用工作流。
PLoS One. 2019 Jul 9;14(7):e0211608. doi: 10.1371/journal.pone.0211608. eCollection 2019.
5
VC@Scale: Scalable and high-performance variant calling on cluster environments.VC@Scale:在集群环境中进行可扩展且高性能的变体调用。
Gigascience. 2021 Sep 7;10(9). doi: 10.1093/gigascience/giab057.
6
Optimizing performance of GATK workflows using Apache Arrow In-Memory data framework.使用 Apache Arrow 内存数据框架优化 GATK 工作流程的性能。
BMC Genomics. 2020 Nov 18;21(Suppl 10):683. doi: 10.1186/s12864-020-07013-y.
7
ILIAD: a suite of automated Snakemake workflows for processing genomic data for downstream applications.ILIAD:一套用于处理基因组数据以用于下游应用的自动化 Snakemake 工作流程套件。
BMC Bioinformatics. 2023 Nov 8;24(1):424. doi: 10.1186/s12859-023-05548-x.
8
ODGI: understanding pangenome graphs.ODGI:理解泛基因组图谱。
Bioinformatics. 2022 Jun 27;38(13):3319-3326. doi: 10.1093/bioinformatics/btac308.
9
OVarFlow: a resource optimized GATK 4 based Open source Variant calling workFlow.OVarFlow:一种基于资源优化的 GATK4 的开源变异调用工作流程。
BMC Bioinformatics. 2021 Aug 13;22(1):402. doi: 10.1186/s12859-021-04317-y.
10
Evaluation of serverless computing for scalable execution of a joint variant calling workflow.评估无服务器计算在联合变异调用工作流可伸缩执行中的应用。
PLoS One. 2021 Jul 9;16(7):e0254363. doi: 10.1371/journal.pone.0254363. eCollection 2021.

引用本文的文献

1
Exploiting uniqueness: seed-chain-extend alignment on elastic founder graphs.利用独特性:弹性奠基者图上的种子-链-扩展比对
Bioinformatics. 2025 Jul 1;41(Supplement_1):i265-i274. doi: 10.1093/bioinformatics/btaf225.
2
Haplotype Matching with GBWT for Pangenome Graphs.用于泛基因组图的基于广义布隆游走树的单倍型匹配
bioRxiv. 2025 Feb 7:2025.02.03.634410. doi: 10.1101/2025.02.03.634410.
3
Tackling reference bias in genotyping by using founder sequences with PanVC 3.使用PanVC 3的奠基者序列解决基因分型中的参考偏差问题。
Bioinform Adv. 2024 Mar 4;4(1):vbae027. doi: 10.1093/bioadv/vbae027. eCollection 2024.
4
Constructing founder sets under allelic and non-allelic homologous recombination.在等位基因和非等位基因同源重组情况下构建奠基者集。
Algorithms Mol Biol. 2023 Sep 29;18(1):15. doi: 10.1186/s13015-023-00241-3.
5
Matchtigs: minimum plain text representation of k-mer sets.匹配项:k-mer 集的最小纯文本表示。
Genome Biol. 2023 Jun 9;24(1):136. doi: 10.1186/s13059-023-02968-z.