• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用李和斯蒂芬斯模型在大样本中进行单体型匹配。

Haplotype matching in large cohorts using the Li and Stephens model.

机构信息

University of Oxford, Wellcome Centre for Human Genetics, Oxford, UK.

出版信息

Bioinformatics. 2019 Mar 1;35(5):798-806. doi: 10.1093/bioinformatics/bty735.

DOI:10.1093/bioinformatics/bty735
PMID:30165547
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6394399/
Abstract

MOTIVATION

The Li and Stephens model, which approximates the coalescent describing the pattern of variation in a population, underpins a range of key tools and results in genetics. Although highly efficient compared to the coalescent, standard implementations of this model still cannot deal with the very large reference cohorts that are starting to become available, and practical implementations use heuristics to achieve reasonable runtimes.

RESULTS

Here I describe a new, exact algorithm ('fastLS') that implements the Li and Stephens model and achieves runtimes independent of the size of the reference cohort. Key to achieving this runtime is the use of the Burrows-Wheeler transform, allowing the algorithm to efficiently identify partial haplotype matches across a cohort. I show that the proposed data structure is very similar to, and generalizes, Durbin's positional Burrows-Wheeler transform.

摘要

动机

李-斯蒂芬斯模型(Li and Stephens model),它近似于描述群体中变异模式的合并模型(coalescent),是遗传学中一系列关键工具和成果的基础。尽管与合并模型相比,该模型的标准实现效率更高,但它仍然无法处理开始变得可用的非常大的参考队列,实际实现使用启发式方法来实现合理的运行时间。

结果

在这里,我描述了一种新的、精确的算法('fastLS'),它实现了李-斯蒂芬斯模型,并实现了与参考队列大小无关的运行时间。实现这种运行时间的关键是使用 Burrows-Wheeler 变换,允许算法在整个队列中有效地识别部分单倍型匹配。我表明,所提出的数据结构与 Durbin 的位置 Burrows-Wheeler 变换非常相似,并对其进行了推广。

相似文献

1
Haplotype matching in large cohorts using the Li and Stephens model.利用李和斯蒂芬斯模型在大样本中进行单体型匹配。
Bioinformatics. 2019 Mar 1;35(5):798-806. doi: 10.1093/bioinformatics/bty735.
2
Efficient haplotype matching between a query and a panel for genealogical search.针对系谱搜索,查询与面板之间的高效单倍型匹配。
Bioinformatics. 2019 Jul 15;35(14):i233-i241. doi: 10.1093/bioinformatics/btz347.
3
d-PBWT: dynamic positional Burrows-Wheeler transform.d-PBWT:动态位置布罗算法变换
Bioinformatics. 2021 Aug 25;37(16):2390-2397. doi: 10.1093/bioinformatics/btab117.
4
Efficient haplotype matching and storage using the positional Burrows-Wheeler transform (PBWT).利用位置 Burrows-Wheeler 变换 (PBWT) 实现高效单倍型匹配和存储。
Bioinformatics. 2014 May 1;30(9):1266-72. doi: 10.1093/bioinformatics/btu014. Epub 2014 Jan 9.
5
Reference-based phasing using the Haplotype Reference Consortium panel.使用单倍型参考联盟面板进行基于参考的定相
Nat Genet. 2016 Nov;48(11):1443-1448. doi: 10.1038/ng.3679. Epub 2016 Oct 3.
6
Minimal positional substring cover is a haplotype threading alternative to Li and Stephens model.最小位置子串覆盖是替代 Li 和 Stephens 模型的单倍型连接方法。
Genome Res. 2023 Jul;33(7):1007-1014. doi: 10.1101/gr.277673.123. Epub 2023 Jun 14.
7
Syllable-PBWT for space-efficient haplotype long-match query.基于音节的 PBWT 用于高效空间的单倍型长匹配查询。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac734.
8
Fast and Robust Identity-by-Descent Inference with the Templated Positional Burrows-Wheeler Transform.基于模板化位置 Burrows-Wheeler 变换的快速稳健的同宗推断。
Mol Biol Evol. 2021 May 4;38(5):2131-2151. doi: 10.1093/molbev/msaa328.
9
Minimal Positional Substring Cover: A Haplotype Threading Alternative to Li & Stephens Model.最小位置子串覆盖:一种替代李和斯蒂芬斯模型的单倍型穿线法
bioRxiv. 2023 Jan 6:2023.01.04.522803. doi: 10.1101/2023.01.04.522803.
10
Multi-allelic positional Burrows-Wheeler transform.多等位基因位置 Burrows-Wheeler 变换。
BMC Bioinformatics. 2019 Jun 6;20(Suppl 11):279. doi: 10.1186/s12859-019-2821-6.

引用本文的文献

1
Exact Decoding of a Sequentially Markov Coalescent Model in Genetics.遗传学中顺序马尔可夫合并模型的精确解码
J Am Stat Assoc. 2024;119(547):2242-2255. doi: 10.1080/01621459.2023.2252570. Epub 2023 Oct 3.
2
The solution surface of the Li-Stephens haplotype copying model.李-斯蒂芬斯单倍型复制模型的解曲面。
Algorithms Mol Biol. 2023 Aug 9;18(1):12. doi: 10.1186/s13015-023-00237-z.
3
Minimal positional substring cover is a haplotype threading alternative to Li and Stephens model.最小位置子串覆盖是替代 Li 和 Stephens 模型的单倍型连接方法。

本文引用的文献

1
scrm: efficiently simulating long sequences using the approximated coalescent with recombination.scrm:使用带重组的近似合并过程高效模拟长序列。
Bioinformatics. 2015 May 15;31(10):1680-2. doi: 10.1093/bioinformatics/btu861. Epub 2015 Jan 8.
2
Efficient haplotype matching and storage using the positional Burrows-Wheeler transform (PBWT).利用位置 Burrows-Wheeler 变换 (PBWT) 实现高效单倍型匹配和存储。
Bioinformatics. 2014 May 1;30(9):1266-72. doi: 10.1093/bioinformatics/btu014. Epub 2014 Jan 9.
3
Inference of human population history from individual whole-genome sequences.
Genome Res. 2023 Jul;33(7):1007-1014. doi: 10.1101/gr.277673.123. Epub 2023 Jun 14.
4
Minimal Positional Substring Cover: A Haplotype Threading Alternative to Li & Stephens Model.最小位置子串覆盖:一种替代李和斯蒂芬斯模型的单倍型穿线法
bioRxiv. 2023 Jan 6:2023.01.04.522803. doi: 10.1101/2023.01.04.522803.
5
A comparative analysis of current phasing and imputation software.当前相位分析和插补软件的比较分析。
PLoS One. 2022 Oct 19;17(10):e0260177. doi: 10.1371/journal.pone.0260177. eCollection 2022.
6
hapCon: estimating contamination of ancient genomes by copying from reference haplotypes.hapCon:通过从参考单倍型复制来估计古代基因组的污染。
Bioinformatics. 2022 Aug 2;38(15):3768-3777. doi: 10.1093/bioinformatics/btac390.
7
d-PBWT: dynamic positional Burrows-Wheeler transform.d-PBWT:动态位置布罗算法变换
Bioinformatics. 2021 Aug 25;37(16):2390-2397. doi: 10.1093/bioinformatics/btab117.
8
Finding all maximal perfect haplotype blocks in linear time.在线性时间内找到所有最大完美单倍型块。
Algorithms Mol Biol. 2020 Feb 10;15:2. doi: 10.1186/s13015-020-0163-6. eCollection 2020.
9
An average-case sublinear forward algorithm for the haploid Li and Stephens model.用于单倍体李和斯蒂芬斯模型的平均情况次线性前向算法。
Algorithms Mol Biol. 2019 Apr 2;14:11. doi: 10.1186/s13015-019-0144-9. eCollection 2019.
10
Deconvolution of multiple infections in Plasmodium falciparum from high throughput sequencing data.高通量测序数据中疟原虫多重感染的去卷积。
Bioinformatics. 2018 Jan 1;34(1):9-15. doi: 10.1093/bioinformatics/btx530.
从个体全基因组序列推断人类种群历史。
Nature. 2011 Jul 13;475(7357):493-6. doi: 10.1038/nature10231.
4
A flexible and accurate genotype imputation method for the next generation of genome-wide association studies.一种用于下一代全基因组关联研究的灵活且准确的基因型填充方法。
PLoS Genet. 2009 Jun;5(6):e1000529. doi: 10.1371/journal.pgen.1000529. Epub 2009 Jun 19.
5
Fast and accurate short read alignment with Burrows-Wheeler transform.使用Burrows-Wheeler变换进行快速准确的短读比对。
Bioinformatics. 2009 Jul 15;25(14):1754-60. doi: 10.1093/bioinformatics/btp324. Epub 2009 May 18.
6
Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.短DNA序列与人类基因组的超快速且内存高效比对。
Genome Biol. 2009;10(3):R25. doi: 10.1186/gb-2009-10-3-r25. Epub 2009 Mar 4.
7
Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls.对14000例七种常见疾病患者及3000例共享对照进行全基因组关联研究。
Nature. 2007 Jun 7;447(7145):661-78. doi: 10.1038/nature05911.
8
A haplotype map of the human genome.人类基因组单倍型图谱。
Nature. 2005 Oct 27;437(7063):1299-320. doi: 10.1038/nature04226.
9
Modeling linkage disequilibrium and identifying recombination hotspots using single-nucleotide polymorphism data.利用单核苷酸多态性数据对连锁不平衡进行建模并识别重组热点。
Genetics. 2003 Dec;165(4):2213-33. doi: 10.1093/genetics/165.4.2213.
10
Properties of a neutral allele model with intragenic recombination.具有基因内重组的中性等位基因模型的性质。
Theor Popul Biol. 1983 Apr;23(2):183-201. doi: 10.1016/0040-5809(83)90013-8.