• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PBSIM:PacBio reads 模拟器——实现更精确的基因组组装。

PBSIM: PacBio reads simulator--toward accurate genome assembly.

机构信息

Information and Mathematical Science and Bioinformatics Co., Ltd., Toshima-ku, Tokyo 170-0013, Japan.

出版信息

Bioinformatics. 2013 Jan 1;29(1):119-21. doi: 10.1093/bioinformatics/bts649. Epub 2012 Nov 4.

DOI:10.1093/bioinformatics/bts649
PMID:23129296
Abstract

MOTIVATION

PacBio sequencers produce two types of characteristic reads (continuous long reads: long and high error rate and circular consensus sequencing: short and low error rate), both of which could be useful for de novo assembly of genomes. Currently, there is no available simulator that targets the specific generation of PacBio libraries.

RESULTS

Our analysis of 13 PacBio datasets showed characteristic features of PacBio reads (e.g. the read length of PacBio reads follows a log-normal distribution). We have developed a read simulator, PBSIM, that captures these features using either a model-based or sampling-based method. Using PBSIM, we conducted several hybrid error correction and assembly tests for PacBio reads, suggesting that a continuous long reads coverage depth of at least 15 in combination with a circular consensus sequencing coverage depth of at least 30 achieved extensive assembly results.

AVAILABILITY

PBSIM is freely available from the web under the GNU GPL v2 license (http://code.google.com/p/pbsim/).

摘要

动机

PacBio 测序仪产生两种类型的特征读长(连续长读长:错误率高且长,和环形一致性测序:错误率低且短),这两者都可用于基因组从头组装。目前,还没有针对 PacBio 文库的特定生成的可用模拟器。

结果

我们对 13 个 PacBio 数据集的分析显示了 PacBio 读长的特征(例如,PacBio 读长的读长遵循对数正态分布)。我们开发了一个读长模拟器 PBSIM,它使用基于模型或基于采样的方法来捕获这些特征。使用 PBSIM,我们对 PacBio 读长进行了几次混合纠错和组装测试,表明至少 15 倍的连续长读长覆盖率和至少 30 倍的环形一致性测序覆盖率可以实现广泛的组装结果。

可用性

PBSIM 可在 GNU GPL v2 许可证下(http://code.google.com/p/pbsim/)从网上免费获得。

相似文献

1
PBSIM: PacBio reads simulator--toward accurate genome assembly.PBSIM:PacBio reads 模拟器——实现更精确的基因组组装。
Bioinformatics. 2013 Jan 1;29(1):119-21. doi: 10.1093/bioinformatics/bts649. Epub 2012 Nov 4.
2
NPBSS: a new PacBio sequencing simulator for generating the continuous long reads with an empirical model.NPBSS:一种新的 PacBio 测序模拟器,用于基于经验模型生成连续的长读长。
BMC Bioinformatics. 2018 May 22;19(1):177. doi: 10.1186/s12859-018-2208-0.
3
PaSS: a sequencing simulator for PacBio sequencing.PaSS:一种用于 PacBio 测序的测序模拟程序。
BMC Bioinformatics. 2019 Jun 21;20(1):352. doi: 10.1186/s12859-019-2901-7.
4
Organelle_PBA, a pipeline for assembling chloroplast and mitochondrial genomes from PacBio DNA sequencing data.细胞器_PBA,一种用于从PacBio DNA测序数据组装叶绿体和线粒体基因组的流程。
BMC Genomics. 2017 Jan 7;18(1):49. doi: 10.1186/s12864-016-3412-9.
5
A hybrid and scalable error correction algorithm for indel and substitution errors of long reads.一种用于长读段插入/缺失和替换错误的混合可扩展纠错算法。
BMC Genomics. 2019 Dec 20;20(Suppl 11):948. doi: 10.1186/s12864-019-6286-9.
6
RepLong: de novo repeat identification using long read sequencing data.RepLong:利用长读测序数据进行从头重复识别。
Bioinformatics. 2018 Apr 1;34(7):1099-1107. doi: 10.1093/bioinformatics/btx717.
7
Illumina error correction near highly repetitive DNA regions improves de novo genome assembly.Illumina 纠错技术在高度重复 DNA 区域的应用提高了从头基因组组装的质量。
BMC Bioinformatics. 2019 Jun 3;20(1):298. doi: 10.1186/s12859-019-2906-2.
8
Evaluation and Validation of Assembling Corrected PacBio Long Reads for Microbial Genome Completion via Hybrid Approaches.通过混合方法组装校正后的PacBio长读段以完成微生物基因组的评估与验证
PLoS One. 2015 Dec 7;10(12):e0144305. doi: 10.1371/journal.pone.0144305. eCollection 2015.
9
QuorUM: An Error Corrector for Illumina Reads.QuorUM:Illumina测序读数的纠错工具
PLoS One. 2015 Jun 17;10(6):e0130821. doi: 10.1371/journal.pone.0130821. eCollection 2015.
10
Accurate self-correction of errors in long reads using de Bruijn graphs.使用德布鲁因图对长读段中的错误进行准确的自我校正。
Bioinformatics. 2017 Mar 15;33(6):799-806. doi: 10.1093/bioinformatics/btw321.

引用本文的文献

1
Movi Color: fast and accurate long-read classification with the move structure.Movi Color:利用移动结构进行快速准确的长读长分类。
bioRxiv. 2025 May 27:2025.05.22.655637. doi: 10.1101/2025.05.22.655637.
2
Fast noisy long read alignment with multi-level parallelism.基于多级并行的快速噪声长读比对
BMC Bioinformatics. 2025 May 2;26(1):118. doi: 10.1186/s12859-025-06129-w.
3
TIPP3 and TIPP3-fast: Improved abundance profiling in metagenomics.TIPP3和TIPP3-fast:宏基因组学中改进的丰度分析
PLoS Comput Biol. 2025 Apr 4;21(4):e1012593. doi: 10.1371/journal.pcbi.1012593. eCollection 2025 Apr.
4
RAmbler resolves complex repeats in human Chromosomes 8, 19, and X.RAmbler解析人类8号、19号和X染色体中的复杂重复序列。
Genome Res. 2025 Apr 14;35(4):863-876. doi: 10.1101/gr.279308.124.
5
Comprehensive assessment of mRNA isoform detection methods for long-read sequencing data.长读测序数据中 mRNA 异构体检测方法的综合评估。
Nat Commun. 2024 May 10;15(1):3972. doi: 10.1038/s41467-024-48117-3.
6
BEERS2: RNA-Seq simulation through high fidelity in silico modeling.BEERS2:通过高保真的计算机模拟进行 RNA-Seq 模拟。
Brief Bioinform. 2024 Mar 27;25(3). doi: 10.1093/bib/bbae164.
7
A comprehensive benchmark of graph-based genetic variant genotyping algorithms on plant genomes for creating an accurate ensemble pipeline.基于图的遗传变异基因分型算法在植物基因组上的综合基准测试,用于创建一个准确的综合管道。
Genome Biol. 2024 Apr 8;25(1):91. doi: 10.1186/s13059-024-03239-1.
8
Comprehensive assessment of 11 de novo HiFi assemblers on complex eukaryotic genomes and metagenomes.对 11 种从头开始的 HiFi 组装器在复杂真核基因组和宏基因组上的综合评估。
Genome Res. 2024 Mar 20;34(2):326-340. doi: 10.1101/gr.278232.123.
9
Improving error-correcting capability in DNA digital storage via soft-decision decoding.通过软判决解码提高DNA数字存储中的纠错能力。
Natl Sci Rev. 2023 Sep 2;11(2):nwad229. doi: 10.1093/nsr/nwad229. eCollection 2024 Feb.
10
SQANTI-SIM: a simulator of controlled transcript novelty for lrRNA-seq benchmark.SQANTI-SIM:用于 lrRNA-seq 基准测试的受控转录物新颖性的模拟器。
Genome Biol. 2023 Dec 11;24(1):286. doi: 10.1186/s13059-023-03127-0.