• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于染色质相互作用的从头基因组组装的染色体尺度支架。

Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions.

机构信息

Department of Genome Sciences, University of Washington, Seattle, Washington, USA.

出版信息

Nat Biotechnol. 2013 Dec;31(12):1119-25. doi: 10.1038/nbt.2727. Epub 2013 Nov 3.

DOI:10.1038/nbt.2727
PMID:24185095
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4117202/
Abstract

Genomes assembled de novo from short reads are highly fragmented relative to the finished chromosomes of Homo sapiens and key model organisms generated by the Human Genome Project. To address this problem, we need scalable, cost-effective methods to obtain assemblies with chromosome-scale contiguity. Here we show that genome-wide chromatin interaction data sets, such as those generated by Hi-C, are a rich source of long-range information for assigning, ordering and orienting genomic sequences to chromosomes, including across centromeres. To exploit this finding, we developed an algorithm that uses Hi-C data for ultra-long-range scaffolding of de novo genome assemblies. We demonstrate the approach by combining shotgun fragment and short jump mate-pair sequences with Hi-C data to generate chromosome-scale de novo assemblies of the human, mouse and Drosophila genomes, achieving--for the human genome--98% accuracy in assigning scaffolds to chromosome groups and 99% accuracy in ordering and orienting scaffolds within chromosome groups. Hi-C data can also be used to validate chromosomal translocations in cancer genomes.

摘要

从头组装的基因组与人类和关键模式生物的完成染色体相比,相对来说是高度碎片化的,这些完成染色体是由人类基因组计划产生的。为了解决这个问题,我们需要可扩展、具有成本效益的方法来获得具有染色体级连续性的组装。在这里,我们表明全基因组染色质相互作用数据集,如 Hi-C 产生的数据集,是分配、排序和定向基因组序列到染色体的丰富的长程信息来源,包括在着丝粒处。为了利用这一发现,我们开发了一种算法,该算法利用 Hi-C 数据进行从头组装基因组的超远程支架搭建。我们通过将鸟枪法片段和短跳配对序列与 Hi-C 数据相结合,展示了该方法在人类、小鼠和果蝇基因组的染色体级从头组装中的应用,该方法实现了——在人类基因组中——将支架分配到染色体组的准确率为 98%,在染色体组内对支架进行排序和定向的准确率为 99%。Hi-C 数据还可用于验证癌症基因组中的染色体易位。

相似文献

1
Chromosome-scale scaffolding of de novo genome assemblies based on chromatin interactions.基于染色质相互作用的从头基因组组装的染色体尺度支架。
Nat Biotechnol. 2013 Dec;31(12):1119-25. doi: 10.1038/nbt.2727. Epub 2013 Nov 3.
2
Scaffolding of long read assemblies using long range contact information.利用长程接触信息对长读长组装进行支架构建。
BMC Genomics. 2017 Jul 12;18(1):527. doi: 10.1186/s12864-017-3879-z.
3
Improvement of the Threespine Stickleback Genome Using a Hi-C-Based Proximity-Guided Assembly.利用基于Hi-C的邻近引导组装改进三刺鱼基因组
J Hered. 2017 Sep 1;108(6):693-700. doi: 10.1093/jhered/esx058.
4
OMGS: Optical Map-Based Genome Scaffolding.OMGS:基于光学图谱的基因组支架构建
J Comput Biol. 2020 Apr;27(4):519-533. doi: 10.1089/cmb.2019.0310. Epub 2019 Dec 3.
5
High-throughput genome scaffolding from in vivo DNA interaction frequency.基于体内 DNA 相互作用频率的高通量基因组支架搭建。
Nat Biotechnol. 2013 Dec;31(12):1143-7. doi: 10.1038/nbt.2768. Epub 2013 Nov 24.
6
Extended haplotype-phasing of long-read de novo genome assemblies using Hi-C.利用 Hi-C 对长读从头基因组组装进行扩展单倍型相位分析。
Nat Commun. 2021 Apr 28;12(1):1935. doi: 10.1038/s41467-020-20536-y.
7
De novo assembly of the genome using Hi-C yields chromosome-length scaffolds.使用Hi-C技术对基因组进行从头组装可产生染色体长度的支架。
Science. 2017 Apr 7;356(6333):92-95. doi: 10.1126/science.aal3327. Epub 2017 Mar 23.
8
Hi-C scaffolded short- and long-read genome assemblies of the California sea lion are broadly consistent for syntenic inference across 45 million years of evolution.高分辨率连接(Hi-C)构建的加利福尼亚海狮短读长读基因组组装结果在跨越 4500 万年进化的共线性推断方面具有广泛的一致性。
Mol Ecol Resour. 2021 Oct;21(7):2455-2470. doi: 10.1111/1755-0998.13443. Epub 2021 Jun 27.
9
Genomes in 3D improve one-dimensional assemblies.三维基因组可改进一维组装。
Nat Methods. 2014 Jan;11(1):5. doi: 10.1038/nmeth.2795.
10
SLIQ: simple linear inequalities for efficient contig scaffolding.SLIQ:用于高效重叠群支架构建的简单线性不等式
J Comput Biol. 2012 Oct;19(10):1162-75. doi: 10.1089/cmb.2011.0263.

引用本文的文献

1
Chromosomal-level genome assembly of an allotetraploid oyster.异源四倍体牡蛎的染色体水平基因组组装
Sci Data. 2025 Aug 26;12(1):1492. doi: 10.1038/s41597-025-05775-2.
2
Chromosome-level genome assembly and annotation of Amur Pike (Esox reichertii).黑龙江狗鱼(Esox reichertii)的染色体水平基因组组装与注释
Sci Data. 2025 Aug 20;12(1):1454. doi: 10.1038/s41597-025-05819-7.
3
Near telomere-to-telomere genome assembly of Camellia pitardii.毛籽金花茶的近端粒到端粒基因组组装

本文引用的文献

1
The haplotype-resolved genome and epigenome of the aneuploid HeLa cancer cell line.非整倍体 HeLa 癌细胞系的单体型解析基因组和表观基因组。
Nature. 2013 Aug 8;500(7461):207-11. doi: 10.1038/nature12064.
2
The genomic and transcriptomic landscape of a HeLa cell line.一个 HeLa 细胞系的基因组和转录组景观。
G3 (Bethesda). 2013 Aug 7;3(8):1213-24. doi: 10.1534/g3.113.005777.
3
The genome of Prunus mume.李属梅花基因组。
Sci Data. 2025 Aug 14;12(1):1422. doi: 10.1038/s41597-025-05764-5.
4
De novo genome assembly of Yanbian cattle using PacBio HiFi and Hi-C combined with RNA-seq data.利用PacBio HiFi和Hi-C结合RNA-seq数据对延边牛进行从头基因组组装。
Sci Data. 2025 Aug 11;12(1):1399. doi: 10.1038/s41597-025-05689-z.
5
Chromosome-level genome assembly of the autotetraploid yellow pitaya provides novel insights into evolution of trait patterning in pitaya species with different ploidy.同源四倍体黄火龙果的染色体水平基因组组装为不同倍性火龙果物种的性状模式进化提供了新见解。
Genome Biol. 2025 Aug 6;26(1):234. doi: 10.1186/s13059-025-03695-3.
6
Chromosome-level reference genome of var. provides insights into a new locus of resistance to grapevine powdery mildew.葡萄品种的染色体水平参考基因组为葡萄白粉病抗性新位点研究提供了见解。
Hortic Res. 2025 Jun 10;12(9):uhaf146. doi: 10.1093/hr/uhaf146. eCollection 2025 Sep.
7
Chromosome-level genome assembly of Ampulex clypecomplana Chen & Li (Hymenoptera: Ampulicidae).陈氏扁足泥蜂(膜翅目:扁足泥蜂科)的染色体水平基因组组装
Sci Data. 2025 Jul 30;12(1):1328. doi: 10.1038/s41597-025-05676-4.
8
Integrating genome assembly, structural variation map construction and GWAS reveal the impact of SVs on agronomic traits of Brassica napus.整合基因组组装、结构变异图谱构建和全基因组关联研究揭示了结构变异对甘蓝型油菜农艺性状的影响。
Theor Appl Genet. 2025 Jul 26;138(8):191. doi: 10.1007/s00122-025-04977-x.
9
Ancient allopolyploidy and specific subgenomic evolution drove the radiation of poplars and willows.古代异源多倍体和特定的亚基因组进化推动了杨树和柳树的辐射演化。
Nat Commun. 2025 Jul 25;16(1):6881. doi: 10.1038/s41467-025-62178-y.
10
Comparative genomics of the parasite Trichomonas vaginalis reveals genes involved in spillover from birds to humans.阴道毛滴虫的比较基因组学揭示了参与从鸟类传播到人类的基因。
Nat Commun. 2025 Jul 24;16(1):6487. doi: 10.1038/s41467-025-61483-w.
Nat Commun. 2012;3:1318. doi: 10.1038/ncomms2290.
4
Sequencing and automated whole-genome optical mapping of the genome of a domestic goat (Capra hircus).家山羊(Capra hircus)基因组的测序和全基因组光学图谱自动化构建。
Nat Biotechnol. 2013 Feb;31(2):135-41. doi: 10.1038/nbt.2478. Epub 2012 Dec 23.
5
The expanding scope of DNA sequencing.DNA 测序的扩展范围。
Nat Biotechnol. 2012 Nov;30(11):1084-94. doi: 10.1038/nbt.2421. Epub 2012 Nov 8.
6
The oyster genome reveals stress adaptation and complexity of shell formation.牡蛎基因组揭示了其对压力的适应能力和贝壳形成的复杂性。
Nature. 2012 Oct 4;490(7418):49-54. doi: 10.1038/nature11413. Epub 2012 Sep 19.
7
Genome mapping on nanochannel arrays for structural variation analysis and sequence assembly.用于结构变异分析和序列组装的纳米通道阵列上的基因组作图。
Nat Biotechnol. 2012 Aug;30(8):771-6. doi: 10.1038/nbt.2303.
8
MORC family ATPases required for heterochromatin condensation and gene silencing.MORC 家族 ATP 酶对于异染色质凝聚和基因沉默是必需的。
Science. 2012 Jun 15;336(6087):1448-51. doi: 10.1126/science.1221472. Epub 2012 May 3.
9
Topological domains in mammalian genomes identified by analysis of chromatin interactions.哺乳动物基因组中通过分析染色质相互作用而鉴定的拓扑结构域。
Nature. 2012 Apr 11;485(7398):376-80. doi: 10.1038/nature11082.
10
The Drosophila melanogaster Genetic Reference Panel.黑腹果蝇遗传参考面板。
Nature. 2012 Feb 8;482(7384):173-8. doi: 10.1038/nature10811.