• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ViPRA-Haplo:利用配对末端测序数据进行病毒群体的从头重建。

ViPRA-Haplo: De Novo Reconstruction of Viral Populations Using Paired End Sequencing Data.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2024 May-Jun;21(3):492-500. doi: 10.1109/TCBB.2024.3374595. Epub 2024 Jun 5.

DOI:10.1109/TCBB.2024.3374595
PMID:38451771
Abstract

We present ViPRA-Haplo, a de novo strain-specific assembly workflow for reconstructing viral haplotypes in a viral population from paired-end next generation sequencing (NGS) data. The proposed Viral Path Reconstruction Algorithm (ViPRA) generates a subset of paths from a De Bruijn graph of reads using the pairing information of reads. The paths generated by ViPRA are an over-estimation of the true contigs. We propose two refinement methods to obtain an optimal set of contigs representing viral haplotypes. The first method clusters paths reconstructed by ViPRA using VSEARCH Deorowicz et al. 2015 based on sequence similarity, while the second method, MLEHaplo, generates a maximum likelihood estimate of viral populations. We evaluated our pipeline on both simulated and real viral quasispecies data from HIV (and real data from SARS-COV-2). Experimental results show that ViPRA-Haplo, although still an overestimation in the number of true contigs, outperforms the existing tool, PEHaplo, providing up to 9% better genome coverage on HIV real data. In addition, ViPRA-Haplo also retains higher diversity of the viral population as demonstrated by the presence of a higher percentage of contigs less than 1000 base pairs (bps), which also contain k-mers with counts less than 100 (representing rarer sequences), which are absent in PEHaplo. For SARS-CoV-2 sequencing data, ViPRA-Haplo reconstructs contigs that cover more than 90% of the reference genome and were able to validate known SARS-CoV-2 strains in the sequencing data.

摘要

我们提出了 ViPRA-Haplo,这是一种从头开始的、针对病毒群体的菌株特异性组装工作流程,可用于从配对末端下一代测序 (NGS) 数据中重建病毒单倍型。所提出的病毒路径重建算法 (ViPRA) 使用reads 的配对信息从reads 的 De Bruijn 图中生成路径的子集。由 ViPRA 生成的路径是真实 contigs 的高估。我们提出了两种改进方法来获得代表病毒单倍型的最佳 contigs 集。第一种方法使用基于序列相似性的 VSEARCH Deorowicz 等人基于序列相似性对 ViPRA 重建的路径进行聚类。2015 年,第二种方法,MLEHaplo,生成病毒群体的最大似然估计。我们在 HIV 的模拟和真实病毒准种数据以及 SARS-COV-2 的真实数据上评估了我们的管道。实验结果表明,尽管 ViPRA-Haplo 仍然高估了真实 contigs 的数量,但它优于现有的工具 PEHaplo,在 HIV 真实数据上提供高达 9%的更好的基因组覆盖率。此外,ViPRA-Haplo 还保留了更高的病毒群体多样性,这表现为存在更高百分比的小于 1000 个碱基对 (bps) 的 contigs,这些 contigs 还包含计数小于 100 的 k-mers (表示更罕见的序列),而这些在 PEHaplo 中是不存在的。对于 SARS-CoV-2 测序数据,ViPRA-Haplo 重建的 contigs 覆盖了参考基因组的 90%以上,并能够验证测序数据中的已知 SARS-CoV-2 菌株。

相似文献

1
ViPRA-Haplo: De Novo Reconstruction of Viral Populations Using Paired End Sequencing Data.ViPRA-Haplo:利用配对末端测序数据进行病毒群体的从头重建。
IEEE/ACM Trans Comput Biol Bioinform. 2024 May-Jun;21(3):492-500. doi: 10.1109/TCBB.2024.3374595. Epub 2024 Jun 5.
2
De novo haplotype reconstruction in viral quasispecies using paired-end read guided path finding.利用配对末端读指导路径寻找技术对病毒准种进行从头单倍型重建。
Bioinformatics. 2018 Sep 1;34(17):2927-2935. doi: 10.1093/bioinformatics/bty202.
3
Validation of Variant Assembly Using HAPHPIPE with Next-Generation Sequence Data from Viruses.使用 HAPHPIPE 对病毒的下一代序列数据进行变体组装验证。
Viruses. 2020 Jul 14;12(7):758. doi: 10.3390/v12070758.
4
A binning tool to reconstruct viral haplotypes from assembled contigs.一种从组装的连续序列中重建病毒单倍型的分箱工具。
BMC Bioinformatics. 2019 Nov 4;20(1):544. doi: 10.1186/s12859-019-3138-1.
5
Inference of viral quasispecies with a paired de Bruijn graph.基于配对 de Bruijn 图的病毒准种推断。
Bioinformatics. 2021 May 1;37(4):473-481. doi: 10.1093/bioinformatics/btaa782.
6
ViQUF: De Novo Viral Quasispecies Reconstruction Using Unitig-Based Flow Networks.ViQUF:使用基于单元重叠群的流网络进行从头病毒准种重建。
IEEE/ACM Trans Comput Biol Bioinform. 2023 Mar-Apr;20(2):1550-1562. doi: 10.1109/TCBB.2022.3190282. Epub 2023 Apr 3.
7
Full-length de novo viral quasispecies assembly through variation graph construction.通过变异图构建进行全长从头病毒准种组装。
Bioinformatics. 2019 Dec 15;35(24):5086-5094. doi: 10.1093/bioinformatics/btz443.
8
aBayesQR: A Bayesian Method for Reconstruction of Viral Populations Characterized by Low Diversity.aBayesQR:一种用于重建低多样性特征病毒群体的贝叶斯方法。
J Comput Biol. 2018 Jul;25(7):637-648. doi: 10.1089/cmb.2017.0249. Epub 2018 Feb 26.
9
Strainline: full-length de novo viral haplotype reconstruction from noisy long reads.Strainline:从嘈杂的长读段中全长从头重建病毒单倍型。
Genome Biol. 2022 Jan 20;23(1):29. doi: 10.1186/s13059-021-02587-6.
10
Fragmentation and Coverage Variation in Viral Metagenome Assemblies, and Their Effect in Diversity Calculations.病毒宏基因组组装中的碎片化和覆盖度变化,及其对多样性计算的影响。
Front Bioeng Biotechnol. 2015 Sep 17;3:141. doi: 10.3389/fbioe.2015.00141. eCollection 2015.

引用本文的文献

1
Strain-resolved de-novo metagenomic assembly of viral genomes and microbial 16S rRNAs.病毒基因组和微生物16S rRNA的菌株解析从头宏基因组组装
Microbiome. 2024 Oct 1;12(1):187. doi: 10.1186/s40168-024-01904-y.
2
Computational graph pangenomics: a tutorial on data structures and their applications.计算图泛基因组学:数据结构及其应用教程
Nat Comput. 2022 Mar;21(1):81-108. doi: 10.1007/s11047-022-09882-6. Epub 2022 Mar 4.
3
Epidemiological data analysis of viral quasispecies in the next-generation sequencing era.下一代测序时代病毒准种的流行病学数据分析。
Brief Bioinform. 2021 Jan 18;22(1):96-108. doi: 10.1093/bib/bbaa101.
4
PIQMEE: Bayesian Phylodynamic Method for Analysis of Large Data Sets with Duplicate Sequences.PIQMEE:具有重复序列的大数据集的贝叶斯系统发育分析方法。
Mol Biol Evol. 2020 Oct 1;37(10):3061-3075. doi: 10.1093/molbev/msaa136.
5
Evaluation of haplotype callers for next-generation sequencing of viruses.病毒下一代测序中单体型caller 的评估。
Infect Genet Evol. 2020 Aug;82:104277. doi: 10.1016/j.meegid.2020.104277. Epub 2020 Mar 6.
6
A binning tool to reconstruct viral haplotypes from assembled contigs.一种从组装的连续序列中重建病毒单倍型的分箱工具。
BMC Bioinformatics. 2019 Nov 4;20(1):544. doi: 10.1186/s12859-019-3138-1.
7
De novo assembly of viral quasispecies using overlap graphs.使用重叠图对病毒准种进行从头组装。
Genome Res. 2017 May;27(5):835-848. doi: 10.1101/gr.215038.116. Epub 2017 Apr 10.