• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

多CSAR:一种使用代数重排的基于多参考的重叠群支架构建工具。

Multi-CSAR: a multiple reference-based contig scaffolder using algebraic rearrangements.

作者信息

Chen Kun-Tze, Shen Hsin-Ting, Lu Chin Lung

机构信息

Department of Computer Science, National Tsing Hua University, Hsinchu, 30013, Taiwan.

出版信息

BMC Syst Biol. 2018 Dec 31;12(Suppl 9):139. doi: 10.1186/s12918-018-0654-y.

DOI:10.1186/s12918-018-0654-y
PMID:30598087
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6311912/
Abstract

BACKGROUND

One of the important steps in the process of assembling a genome sequence from short reads is scaffolding, in which the contigs in a draft genome are ordered and oriented into scaffolds. Currently, several scaffolding tools based on a single reference genome have been developed. However, a single reference genome may not be sufficient alone for a scaffolder to generate correct scaffolds of a target draft genome, especially when the evolutionary relationship between the target and reference genomes is distant or some rearrangements occur between them. This motivates the need to develop scaffolding tools that can order and orient the contigs of the target genome using multiple reference genomes.

RESULTS

In this work, we utilize a heuristic method to develop a new scaffolder called Multi-CSAR that is able to accurately scaffold a target draft genome based on multiple reference genomes, each of which does not need to be complete. Our experimental results on real datasets show that Multi-CSAR outperforms other two multiple reference-based scaffolding tools, Ragout and MeDuSa, in terms of many average metrics, such as sensitivity, precision, F-score, genome coverage, NGA50, scaffold number and running time.

CONCLUSIONS

Multi-CSAR is a multiple reference-based scaffolder that can efficiently produce more accurate scaffolds of a target draft genome by referring to multiple complete and/or incomplete genomes of related organisms. Its stand-alone program is available for download at https://github.com/ablab-nthu/Multi-CSAR.

摘要

背景

从短读段组装基因组序列过程中的一个重要步骤是搭建支架,即将草图基因组中的重叠群排序并定向成支架。目前,已经开发了几种基于单个参考基因组的支架搭建工具。然而,对于一个支架搭建工具来说,仅靠单个参考基因组可能不足以生成目标草图基因组的正确支架,特别是当目标基因组与参考基因组之间的进化关系较远或它们之间发生了一些重排时。这促使人们需要开发能够使用多个参考基因组对目标基因组的重叠群进行排序和定向的支架搭建工具。

结果

在这项工作中,我们利用一种启发式方法开发了一种名为Multi-CSAR的新支架搭建工具,它能够基于多个参考基因组准确地为目标草图基因组搭建支架,每个参考基因组不需要完整。我们在真实数据集上的实验结果表明,在许多平均指标方面,如灵敏度、精确率、F值、基因组覆盖率、NGA50、支架数量和运行时间,Multi-CSAR优于其他两种基于多个参考基因组的支架搭建工具Ragout和MeDuSa。

结论

Multi-CSAR是一种基于多个参考基因组的支架搭建工具,通过参考相关生物的多个完整和/或不完整基因组,能够有效地生成目标草图基因组的更准确支架。其独立程序可在https://github.com/ablab-nthu/Multi-CSAR上下载。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4db2/6311912/e53b0ce1e20f/12918_2018_654_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4db2/6311912/f4d9366f1c71/12918_2018_654_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4db2/6311912/e53b0ce1e20f/12918_2018_654_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4db2/6311912/f4d9366f1c71/12918_2018_654_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4db2/6311912/e53b0ce1e20f/12918_2018_654_Fig2_HTML.jpg

相似文献

1
Multi-CSAR: a multiple reference-based contig scaffolder using algebraic rearrangements.多CSAR:一种使用代数重排的基于多参考的重叠群支架构建工具。
BMC Syst Biol. 2018 Dec 31;12(Suppl 9):139. doi: 10.1186/s12918-018-0654-y.
2
CSAR: a contig scaffolding tool using algebraic rearrangements.CSAR:一种使用代数重排进行拼接的工具。
Bioinformatics. 2018 Jan 1;34(1):109-111. doi: 10.1093/bioinformatics/btx543.
3
Multi-CAR: a tool of contig scaffolding using multiple references.多连续片段比对组装工具(Multi-CAR):一种使用多个参考序列进行重叠群搭建的工具。
BMC Bioinformatics. 2016 Dec 23;17(Suppl 17):469. doi: 10.1186/s12859-016-1328-7.
4
CSAR-web: a web server of contig scaffolding using algebraic rearrangements.CSAR-web:一个使用代数重排进行基因簇拼接的网络服务器。
Nucleic Acids Res. 2018 Jul 2;46(W1):W55-W59. doi: 10.1093/nar/gky337.
5
CAR: contig assembly of prokaryotic draft genomes using rearrangements.CAR:利用重排对原核生物草图基因组进行重叠群组装。
BMC Bioinformatics. 2014 Nov 28;15(1):381. doi: 10.1186/s12859-014-0381-3.
6
MeDuSa: a multi-draft based scaffolder.美杜莎:一种基于多草稿的支架构建工具。
Bioinformatics. 2015 Aug 1;31(15):2443-51. doi: 10.1093/bioinformatics/btv171. Epub 2015 Mar 25.
7
Multi-CSAR: a web server for scaffolding contigs using multiple reference genomes.多-CSAR:一个使用多个参考基因组来构建基因组草图的网络服务器。
Nucleic Acids Res. 2022 Jul 5;50(W1):W500-W509. doi: 10.1093/nar/gkac301.
8
SCARPA: scaffolding reads with practical algorithms.SCARPA:使用实用算法进行支架读取。
Bioinformatics. 2013 Feb 15;29(4):428-34. doi: 10.1093/bioinformatics/bts716. Epub 2012 Dec 29.
9
SLR: a scaffolding algorithm based on long reads and contig classification.SLR:一种基于长读段和重叠群分类的支架算法。
BMC Bioinformatics. 2019 Oct 30;20(1):539. doi: 10.1186/s12859-019-3114-9.
10
Assembling contigs in draft genomes using reversals and block-interchanges.利用反转和块交换组装草图基因组中的重叠群。
BMC Bioinformatics. 2013;14 Suppl 5(Suppl 5):S9. doi: 10.1186/1471-2105-14-S5-S9. Epub 2013 Apr 10.

引用本文的文献

1
Pasa: leveraging population pangenome graph to scaffold prokaryote genome assemblies.Pasa:利用人群泛基因组图来构建原核生物基因组组装。
Nucleic Acids Res. 2024 Feb 9;52(3):e15. doi: 10.1093/nar/gkad1170.
2
Genomic Characteristics and Comparative Genomics Analysis of the Endophytic Fungus DS-84 Isolated from Root.从根部分离的内生真菌DS-84的基因组特征及比较基因组学分析
J Fungi (Basel). 2023 Oct 16;9(10):1022. doi: 10.3390/jof9101022.
3
Main genome characteristics of butanol-producing Clostridium sp. UCM В-7570 strain.丁醇产生梭菌 UCM В-7570 菌株的主要基因组特征。

本文引用的文献

1
CSAR: a contig scaffolding tool using algebraic rearrangements.CSAR:一种使用代数重排进行拼接的工具。
Bioinformatics. 2018 Jan 1;34(1):109-111. doi: 10.1093/bioinformatics/btx543.
2
Multi-CAR: a tool of contig scaffolding using multiple references.多连续片段比对组装工具(Multi-CAR):一种使用多个参考序列进行重叠群搭建的工具。
BMC Bioinformatics. 2016 Dec 23;17(Suppl 17):469. doi: 10.1186/s12859-016-1328-7.
3
An efficient algorithm for the contig ordering problem under algebraic rearrangement distance.一种用于代数重排距离下重叠群排序问题的高效算法。
J Appl Genet. 2023 Sep;64(3):559-567. doi: 10.1007/s13353-023-00766-8. Epub 2023 Jun 22.
4
Revealing within-species diversity in uncultured human gut bacteria with single-cell long-read sequencing.利用单细胞长读长测序揭示未培养人类肠道细菌的种内多样性。
Front Microbiol. 2023 Feb 24;14:1133917. doi: 10.3389/fmicb.2023.1133917. eCollection 2023.
5
Insight into the Organization of the B10v3 Cucumber Genome by Integration of Biological and Bioinformatic Data.通过整合生物学和生物信息学数据深入了解 B10v3 黄瓜基因组的组织。
Int J Mol Sci. 2023 Feb 16;24(4):4011. doi: 10.3390/ijms24044011.
J Comput Biol. 2015 Nov;22(11):975-87. doi: 10.1089/cmb.2015.0073. Epub 2015 Aug 6.
4
ScaffMatch: scaffolding algorithm based on maximum weight matching.ScaffMatch:基于最大权重匹配的支架算法。
Bioinformatics. 2015 Aug 15;31(16):2632-8. doi: 10.1093/bioinformatics/btv211. Epub 2015 Apr 17.
5
MeDuSa: a multi-draft based scaffolder.美杜莎:一种基于多草稿的支架构建工具。
Bioinformatics. 2015 Aug 1;31(15):2443-51. doi: 10.1093/bioinformatics/btv171. Epub 2015 Mar 25.
6
CAR: contig assembly of prokaryotic draft genomes using rearrangements.CAR:利用重排对原核生物草图基因组进行重叠群组装。
BMC Bioinformatics. 2014 Nov 28;15(1):381. doi: 10.1186/s12859-014-0381-3.
7
Ragout-a reference-assisted assembly tool for bacterial genomes.烩菜——一种用于细菌基因组的参考辅助组装工具。
Bioinformatics. 2014 Jun 15;30(12):i302-9. doi: 10.1093/bioinformatics/btu280.
8
A comprehensive evaluation of assembly scaffolding tools.装配脚手架工具的综合评估。
Genome Biol. 2014 Mar 3;15(3):R42. doi: 10.1186/gb-2014-15-3-r42.
9
Assembling contigs in draft genomes using reversals and block-interchanges.利用反转和块交换组装草图基因组中的重叠群。
BMC Bioinformatics. 2013;14 Suppl 5(Suppl 5):S9. doi: 10.1186/1471-2105-14-S5-S9. Epub 2013 Apr 10.
10
QUAST: quality assessment tool for genome assemblies.QUAST:基因组组装质量评估工具。
Bioinformatics. 2013 Apr 15;29(8):1072-5. doi: 10.1093/bioinformatics/btt086. Epub 2013 Feb 19.