Suppr超能文献

vamos:使用高效基序集进行可变串联重复序列注释。

vamos: variable-number tandem repeats annotation using efficient motif sets.

机构信息

Department of Quantitative and Computational Biology, University of Southern California, Los Angeles, US.

出版信息

Genome Biol. 2023 Jul 27;24(1):175. doi: 10.1186/s13059-023-03010-y.

Abstract

Roughly 3% of the human genome is composed of variable-number tandem repeats (VNTRs): arrays of motifs at least six bases. These loci are highly polymorphic, yet current approaches that define and merge variants based on alignment breakpoints do not capture their full diversity. Here we present a method vamos: VNTR Annotation using efficient Motif Sets that instead annotates VNTR using repeat composition under different levels of motif diversity. Using vamos we estimate 7.4-16.7 alleles per locus when applied to 74 haplotype-resolved human assemblies, compared to breakpoint-based approaches that estimate 4.0-5.5 alleles per locus.

摘要

人类基因组的大约 3%由可变数串联重复(VNTR)组成:至少六个碱基的基序数组。这些基因座具有高度多态性,但目前基于对齐断点定义和合并变体的方法并不能捕捉到它们的全部多样性。在这里,我们提出了一种使用有效基序集进行 VNTR 注释的方法 vamos:VNTR 注释使用不同基序多样性水平下的重复组成。当应用于 74 个单体型解析的人类组装时,我们使用 vamos 估计每个基因座有 7.4-16.7 个等位基因,而基于断点的方法估计每个基因座有 4.0-5.5 个等位基因。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/04a0/10373352/630d062fd277/13059_2023_3010_Fig1_HTML.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验