• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ARCS:使用链接读取构建基因组草图。

ARCS: scaffolding genome drafts with linked reads.

出版信息

Bioinformatics. 2018 Mar 1;34(5):725-731. doi: 10.1093/bioinformatics/btx675.

DOI:10.1093/bioinformatics/btx675
PMID:29069293
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6030987/
Abstract

MOTIVATION

Sequencing of human genomes is now routine, and assembly of shotgun reads is increasingly feasible. However, assemblies often fail to inform about chromosome-scale structure due to a lack of linkage information over long stretches of DNA-a shortcoming that is being addressed by new sequencing protocols, such as the GemCode and Chromium linked reads from 10 × Genomics.

RESULTS

Here, we present ARCS, an application that utilizes the barcoding information contained in linked reads to further organize draft genomes into highly contiguous assemblies. We show how the contiguity of an ABySS H.sapiens genome assembly can be increased over six-fold, using moderate coverage (25-fold) Chromium data. We expect ARCS to have broad utility in harnessing the barcoding information contained in linked read data for connecting high-quality sequences in genome assembly drafts.

AVAILABILITY AND IMPLEMENTATION

https://github.com/bcgsc/ARCS/.

CONTACT

rwarren@bcgsc.ca.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

人类基因组测序现在已成为常规操作,并且越来越可行的是对霰弹枪读取进行组装。然而,由于缺乏长片段 DNA 的连锁信息,组装往往无法提供染色体规模的结构信息——这一缺点正在通过新的测序技术来解决,例如 10x Genomics 的 GemCode 和 Chromium 连接读取。

结果

在这里,我们展示了 ARCS,这是一种利用连接读取中包含的条形码信息将草案基因组进一步组织成高度连续组装的应用程序。我们展示了如何使用中等覆盖率(25 倍)的 Chromium 数据将 ABySS H.sapiens 基因组组装的连续性提高六倍以上。我们期望 ARCS 在利用连接读取数据中包含的条形码信息来连接基因组组装草案中的高质量序列方面具有广泛的应用。

可用性和实现

https://github.com/bcgsc/ARCS/。

联系人

rwarren@bcgsc.ca。

补充信息

补充数据可在《生物信息学》在线获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/46d717c78892/btx675f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/5403369f4a8b/btx675f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/e977765ab7e5/btx675f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/46d717c78892/btx675f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/5403369f4a8b/btx675f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/e977765ab7e5/btx675f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5745/6030987/46d717c78892/btx675f3.jpg

相似文献

1
ARCS: scaffolding genome drafts with linked reads.ARCS:使用链接读取构建基因组草图。
Bioinformatics. 2018 Mar 1;34(5):725-731. doi: 10.1093/bioinformatics/btx675.
2
ARKS: chromosome-scale scaffolding of human genome drafts with linked read kmers.ARKS:基于链接读取子的人类基因组草图染色体级 scaffolding。
BMC Bioinformatics. 2018 Jun 20;19(1):234. doi: 10.1186/s12859-018-2243-x.
3
Tigmint: correcting assembly errors using linked reads from large molecules.Tigmint:使用来自大分子量的连锁读取来修正组装错误。
BMC Bioinformatics. 2018 Oct 26;19(1):393. doi: 10.1186/s12859-018-2425-6.
4
LongStitch: high-quality genome assembly correction and scaffolding using long reads.LongStitch:使用长读长进行高质量基因组组装纠错和 scaffolding。
BMC Bioinformatics. 2021 Oct 30;22(1):534. doi: 10.1186/s12859-021-04451-7.
5
ntLink: A Toolkit for De Novo Genome Assembly Scaffolding and Mapping Using Long Reads.ntLink:一种使用长读长进行从头基因组组装支架和映射的工具包。
Curr Protoc. 2023 Apr;3(4):e733. doi: 10.1002/cpz1.733.
6
SQUAT: a Sequencing Quality Assessment Tool for data quality assessments of genome assemblies.SQUAT:用于基因组组装数据质量评估的测序质量评估工具。
BMC Genomics. 2019 Apr 18;19(Suppl 9):238. doi: 10.1186/s12864-019-5445-3.
7
RepLong: de novo repeat identification using long read sequencing data.RepLong:利用长读测序数据进行从头重复识别。
Bioinformatics. 2018 Apr 1;34(7):1099-1107. doi: 10.1093/bioinformatics/btx717.
8
ntEdit: scalable genome sequence polishing.ntEdit:可扩展的基因组序列优化。
Bioinformatics. 2019 Nov 1;35(21):4430-4432. doi: 10.1093/bioinformatics/btz400.
9
GAPPadder: a sensitive approach for closing gaps on draft genomes with short sequence reads.GAPPadder:一种使用短序列读长来闭合草图基因组缺口的灵敏方法。
BMC Genomics. 2019 Jun 6;20(Suppl 5):426. doi: 10.1186/s12864-019-5703-4.
10
scanPAV: a pipeline for extracting presence-absence variations in genome pairs.scanPAV:用于提取基因组对中存在-缺失变异的管道。
Bioinformatics. 2018 Sep 1;34(17):3022-3024. doi: 10.1093/bioinformatics/bty189.

引用本文的文献

1
Local gene duplications drive extensive NLR copy number variation across multiple genotypes of Theobroma cacao.局部基因重复驱动了可可树多种基因型间广泛的NLR拷贝数变异。
G3 (Bethesda). 2025 Sep 3;15(9). doi: 10.1093/g3journal/jkaf147.
2
A high-quality genome assembly of Annona squamosa (custard apple) provides functional insights into an emerging fruit crop.番荔枝(释迦果)的高质量基因组组装为一种新兴水果作物提供了功能见解。
DNA Res. 2025 May 28;32(3). doi: 10.1093/dnares/dsaf007.
3
Establishing genome sequencing and assembly for non-model and emerging model organisms: a brief guide.

本文引用的文献

1
Direct determination of diploid genome sequences.二倍体基因组序列的直接测定。
Genome Res. 2017 May;27(5):757-767. doi: 10.1101/gr.214874.116. Epub 2017 Apr 5.
2
ABySS 2.0: resource-efficient assembly of large genomes using a Bloom filter.ABySS 2.0:使用布隆过滤器对大型基因组进行资源高效组装。
Genome Res. 2017 May;27(5):768-777. doi: 10.1101/gr.214346.116. Epub 2017 Feb 23.
3
Genome assembly from synthetic long read clouds.基于合成长读段云的基因组组装
为非模式生物和新兴模式生物建立基因组测序与组装:简要指南
Front Zool. 2025 Apr 17;22(1):7. doi: 10.1186/s12983-025-00561-7.
4
Molecular evolution of dietary shifts in ladybird beetles (Coleoptera: Coccinellidae): from fungivory to carnivory and herbivory.瓢虫(鞘翅目:瓢虫科)食性转变的分子进化:从食菌性到食肉性和食草性。
BMC Biol. 2025 Feb 28;23(1):67. doi: 10.1186/s12915-025-02174-2.
5
Chromosome-level reference genome assembly of the gyrfalcon (Falco rusticolus) and population genomics offer insights into the falcon population in Mongolia.矛隼(矛隼)的染色体水平参考基因组组装和群体基因组学为了解蒙古的矛隼种群提供了见解。
Sci Rep. 2025 Feb 4;15(1):4154. doi: 10.1038/s41598-025-88216-9.
6
The haplotype-phased genome assembly facilitated the deciphering of the bud dormancy-related QTLs in Prunus mume.单倍型定相基因组组装有助于解析梅花中与芽休眠相关的数量性状基因座。
DNA Res. 2024 Dec 27;32(1). doi: 10.1093/dnares/dsae034.
7
Repeat-Rich Regions Cause False-Positive Detection of NUMTs: A Case Study in Amphibians Using an Improved Cane Toad Reference Genome.富含重复序列区域导致 NUMTs 的假阳性检测:以改良蟾蜍参考基因组为例的两栖动物研究
Genome Biol Evol. 2024 Nov 1;16(11). doi: 10.1093/gbe/evae246.
8
3D chromatin maps of a brown alga reveal U/V sex chromosome spatial organization.褐藻的 3D 染色质图谱揭示了 U/V 性染色体的空间组织。
Nat Commun. 2024 Nov 6;15(1):9590. doi: 10.1038/s41467-024-53453-5.
9
High-quality chromosome-level genome assembly of female reveals sex chromosome and gene organization.雌性的高质量染色体水平基因组组装揭示了性染色体和基因组织。
Heliyon. 2024 Sep 28;10(19):e38687. doi: 10.1016/j.heliyon.2024.e38687. eCollection 2024 Oct 15.
10
Novel Sex-Specific Genes and Diverse Interspecific Expression in the Antennal Transcriptomes of Ithomiine Butterflies.性特异基因在伊波氏蛱蝶触角转录组中的新发现及其种间差异表达
Genome Biol Evol. 2024 Oct 9;16(10). doi: 10.1093/gbe/evae218.
Bioinformatics. 2016 Jun 15;32(12):i216-i224. doi: 10.1093/bioinformatics/btw267.
4
Extensive sequencing of seven human genomes to characterize benchmark reference materials.对七个人类基因组进行广泛测序以表征基准参考材料。
Sci Data. 2016 Jun 7;3:160025. doi: 10.1038/sdata.2016.25.
5
Coming of age: ten years of next-generation sequencing technologies.成年:下一代测序技术的十年
Nat Rev Genet. 2016 May 17;17(6):333-51. doi: 10.1038/nrg.2016.49.
6
A hybrid approach for de novo human genome sequence assembly and phasing.一种用于从头进行人类基因组序列组装和定相的混合方法。
Nat Methods. 2016 Jul;13(7):587-90. doi: 10.1038/nmeth.3865. Epub 2016 May 9.
7
Health and population effects of rare gene knockouts in adult humans with related parents.具有血缘关系的成年人类中罕见基因敲除对健康和人口的影响。
Science. 2016 Apr 22;352(6284):474-7. doi: 10.1126/science.aac8624. Epub 2016 Mar 3.
8
Haplotyping germline and cancer genomes with high-throughput linked-read sequencing.利用高通量连锁读长测序对种系和癌症基因组进行单倍型分型
Nat Biotechnol. 2016 Mar;34(3):303-11. doi: 10.1038/nbt.3432. Epub 2016 Feb 1.
9
LINKS: Scalable, alignment-free scaffolding of draft genomes with long reads.链接:利用长读长对草图基因组进行可扩展的、无比对的支架搭建。
Gigascience. 2015 Aug 4;4:35. doi: 10.1186/s13742-015-0076-3. eCollection 2015.
10
BFC: correcting Illumina sequencing errors.BFC:校正Illumina测序错误。
Bioinformatics. 2015 Sep 1;31(17):2885-7. doi: 10.1093/bioinformatics/btv290. Epub 2015 May 6.