• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

HiFine:整合基于 Hi-C 和 shotgun 的方法来优化宏基因组 contigs 的 bin 划分。

HiFine: integrating Hi-C-based and shotgun-based methods to refine binning of metagenomic contigs.

机构信息

Department of Quantitative and Computational Biology, University of Southern California, Los Angeles, CA 90089, USA.

出版信息

Bioinformatics. 2022 May 26;38(11):2973-2979. doi: 10.1093/bioinformatics/btac295.

DOI:10.1093/bioinformatics/btac295
PMID:35482530
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9154269/
Abstract

MOTIVATION

Metagenomic binning aims to retrieve microbial genomes directly from ecosystems by clustering metagenomic contigs assembled from short reads into draft genomic bins. Traditional shotgun-based binning methods depend on the contigs' composition and abundance profiles and are impaired by the paucity of enough samples to construct reliable co-abundance profiles. When applied to a single sample, shotgun-based binning methods struggle to distinguish closely related species only using composition information. As an alternative binning approach, Hi-C-based binning employs metagenomic Hi-C technique to measure the proximity contacts between metagenomic fragments. However, spurious inter-species Hi-C contacts inevitably generated by incorrect ligations of DNA fragments between species link the contigs from varying genomes, weakening the purity of final draft genomic bins. Therefore, it is imperative to develop a binning pipeline to overcome the shortcomings of both types of binning methods on a single sample.

RESULTS

We develop HiFine, a novel binning pipeline to refine the binning results of metagenomic contigs by integrating both Hi-C-based and shotgun-based binning tools. HiFine designs a strategy of fragmentation for the original bin sets derived from the Hi-C-based and shotgun-based binning methods, which considerably increases the purity of initial bins, followed by merging fragmented bins and recruiting unbinned contigs. We demonstrate that HiFine significantly improves the existing binning results of both types of binning methods and achieves better performance in constructing species genomes on publicly available datasets. To the best of our knowledge, HiFine is the first pipeline to integrate different types of tools for the binning of metagenomic contigs.

AVAILABILITY AND IMPLEMENTATION

HiFine is available at https://github.com/dyxstat/HiFine.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

宏基因组 bin 分法旨在通过将组装自短读长的宏基因组 contigs 聚类为基因组草案 bin 来直接从生态系统中检索微生物基因组。传统的基于 shotgun 的 bin 分法依赖于 contigs 的组成和丰度分布,并且由于缺乏足够的样本构建可靠的共丰度分布而受到影响。当应用于单个样本时,基于 shotgun 的 bin 分法仅使用组成信息难以区分密切相关的物种。作为替代 bin 分法,Hi-C 基于 bin 分法使用宏基因组 Hi-C 技术来测量宏基因组片段之间的接近接触。然而,由于物种间 DNA 片段的不正确连接不可避免地产生了虚假的种间 Hi-C 接触,从而将来自不同基因组的 contigs 联系起来,削弱了最终草案基因组 bin 的纯度。因此,有必要开发一个 bin 分法流程,以克服单个样本中这两种 bin 分法的缺点。

结果

我们开发了 HiFine,这是一种新颖的 bin 分法流程,通过整合基于 Hi-C 和 shotgun 的 bin 分法工具来改进宏基因组 contigs 的 bin 分结果。HiFine 为基于 Hi-C 和 shotgun 的 bin 分法获得的原始 bin 集设计了一种碎片化策略,这极大地提高了初始 bin 的纯度,然后合并碎片化 bin 并招募未 bin 的 contigs。我们证明,HiFine 显著改善了这两种 bin 分法的现有 bin 分结果,并在构建公共可用数据集上的物种基因组方面取得了更好的性能。据我们所知,HiFine 是第一个集成不同类型工具用于宏基因组 contigs bin 分的流程。

可用性和实现

HiFine 可在 https://github.com/dyxstat/HiFine 上获得。

补充信息

补充数据可在生物信息学在线获得。

相似文献

1
HiFine: integrating Hi-C-based and shotgun-based methods to refine binning of metagenomic contigs.HiFine:整合基于 Hi-C 和 shotgun 的方法来优化宏基因组 contigs 的 bin 划分。
Bioinformatics. 2022 May 26;38(11):2973-2979. doi: 10.1093/bioinformatics/btac295.
2
HiCBin: binning metagenomic contigs and recovering metagenome-assembled genomes using Hi-C contact maps.HiCBin:使用 Hi-C 接触图谱对宏基因组 contigs 进行 binning 和恢复宏基因组组装基因组。
Genome Biol. 2022 Feb 28;23(1):63. doi: 10.1186/s13059-022-02626-w.
3
Accurate Binning of Metagenomic Contigs Using Composition, Coverage, and Assembly Graphs.基于组成、覆盖度和组装图对宏基因组序列进行精确分箱。
J Comput Biol. 2022 Dec;29(12):1357-1376. doi: 10.1089/cmb.2022.0262. Epub 2022 Nov 11.
4
Evaluating metagenomics tools for genome binning with real metagenomic datasets and CAMI datasets.评估宏基因组工具在真实宏基因组数据集和 CAMI 数据集上的基因组 binning 效果。
BMC Bioinformatics. 2020 Jul 28;21(1):334. doi: 10.1186/s12859-020-03667-3.
5
GraphBin: refined binning of metagenomic contigs using assembly graphs.GraphBin:使用组装图对宏基因组序列进行精细化分箱。
Bioinformatics. 2020 Jun 1;36(11):3307-3313. doi: 10.1093/bioinformatics/btaa180.
6
Improving contig binning of metagenomic data using [Formula: see text] oligonucleotide frequency dissimilarity.使用[公式:见正文]寡核苷酸频率差异改进宏基因组数据的重叠群分箱
BMC Bioinformatics. 2017 Sep 20;18(1):425. doi: 10.1186/s12859-017-1835-1.
7
CH-Bin: A convex hull based approach for binning metagenomic contigs.CH-Bin:一种基于凸壳的宏基因组 contigs 分箱方法。
Comput Biol Chem. 2022 Oct;100:107734. doi: 10.1016/j.compbiolchem.2022.107734. Epub 2022 Jul 14.
8
CoMet: a workflow using contig coverage and composition for binning a metagenomic sample with high precision.CoMet:一种使用 contig 覆盖度和组成进行宏基因组样本高精度分箱的工作流程。
BMC Bioinformatics. 2017 Dec 28;18(Suppl 16):571. doi: 10.1186/s12859-017-1967-3.
9
CoCoNet: an efficient deep learning tool for viral metagenome binning.CoCoNet:一种用于病毒宏基因组分箱的高效深度学习工具。
Bioinformatics. 2021 Sep 29;37(18):2803-2810. doi: 10.1093/bioinformatics/btab213.
10
Binnacle: Using Scaffolds to Improve the Contiguity and Quality of Metagenomic Bins.罗盘箱:利用支架提高宏基因组分箱的连续性和质量
Front Microbiol. 2021 Feb 24;12:638561. doi: 10.3389/fmicb.2021.638561. eCollection 2021.

引用本文的文献

1
ViralCC retrieves complete viral genomes and virus-host pairs from metagenomic Hi-C data.ViralCC 从宏基因组 Hi-C 数据中检索完整的病毒基因组和病毒-宿主对。
Nat Commun. 2023 Jan 31;14(1):502. doi: 10.1038/s41467-023-35945-y.