• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

量化和减少超短古 DNA 序列分析中的虚假比对。

Quantifying and reducing spurious alignments for the analysis of ultra-short ancient DNA sequences.

机构信息

Max Planck Institute for Evolutionary Anthropology, 04103, Leipzig, Germany.

出版信息

BMC Biol. 2018 Oct 25;16(1):121. doi: 10.1186/s12915-018-0581-9.

DOI:10.1186/s12915-018-0581-9
PMID:30359256
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6202837/
Abstract

BACKGROUND

The study of ancient DNA is hampered by degradation, resulting in short DNA fragments. Advances in laboratory methods have made it possible to retrieve short DNA fragments, thereby improving access to DNA preserved in highly degraded, ancient material. However, such material contains large amounts of microbial contamination in addition to DNA fragments from the ancient organism. The resulting mixture of sequences constitutes a challenge for computational analysis, since microbial sequences are hard to distinguish from the ancient sequences of interest, especially when they are short.

RESULTS

Here, we develop a method to quantify spurious alignments based on the presence or absence of rare variants. We find that spurious alignments are enriched for mismatches and insertion/deletion differences and lack substitution patterns typical of ancient DNA. The impact of spurious alignments can be reduced by filtering on these features and by imposing a sample-specific minimum length cutoff. We apply this approach to sequences from four ~ 430,000-year-old Sima de los Huesos hominin remains, which contain particularly short DNA fragments, and increase the amount of usable sequence data by 17-150%. This allows us to place a third specimen from the site on the Neandertal lineage.

CONCLUSIONS

Our method maximizes the sequence data amenable to genetic analysis from highly degraded ancient material and avoids pitfalls that are associated with the analysis of ultra-short DNA sequences.

摘要

背景

古 DNA 的研究受到降解的阻碍,导致 DNA 片段较短。实验室方法的进步使得从高度降解的古代材料中提取短 DNA 片段成为可能,从而增加了对保存在其中的 DNA 的获取途径。然而,这种材料除了含有来自古老生物体的 DNA 片段外,还含有大量的微生物污染。由此产生的序列混合物对计算分析构成了挑战,因为微生物序列很难与感兴趣的古老序列区分开来,尤其是当它们很短时。

结果

在这里,我们开发了一种基于稀有变异的存在或缺失来量化虚假比对的方法。我们发现,虚假比对富含错配和插入/缺失差异,并且缺乏古老 DNA 的典型替换模式。通过过滤这些特征并施加特定样本的最小长度截止值,可以减少虚假比对的影响。我们将这种方法应用于来自四个约 43 万年前的 Sima de los Huesos 古人类遗骸的序列中,这些遗骸中含有特别短的 DNA 片段,使可用序列数据量增加了 17% 到 150%。这使我们能够将该遗址的第三个标本置于尼安德特人谱系上。

结论

我们的方法最大限度地提高了从高度降解的古代材料中进行遗传分析的序列数据量,并避免了与超短 DNA 序列分析相关的陷阱。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/2f277f76cd71/12915_2018_581_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/01a5b33b9d35/12915_2018_581_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/d9b75729230d/12915_2018_581_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/2bcec2688f2d/12915_2018_581_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/2f277f76cd71/12915_2018_581_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/01a5b33b9d35/12915_2018_581_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/d9b75729230d/12915_2018_581_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/2bcec2688f2d/12915_2018_581_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c596/6202837/2f277f76cd71/12915_2018_581_Fig4_HTML.jpg

相似文献

1
Quantifying and reducing spurious alignments for the analysis of ultra-short ancient DNA sequences.量化和减少超短古 DNA 序列分析中的虚假比对。
BMC Biol. 2018 Oct 25;16(1):121. doi: 10.1186/s12915-018-0581-9.
2
Nuclear DNA sequences from the Middle Pleistocene Sima de los Huesos hominins.中更新世西语人骨化石的核 DNA 序列。
Nature. 2016 Mar 24;531(7595):504-7. doi: 10.1038/nature17405. Epub 2016 Mar 14.
3
Denisovans, Melanesians, Europeans, and Neandertals: The Confusion of DNA Assumptions and the Biological Species Concept.丹尼索瓦人、美拉尼西亚人、欧洲人和尼安德特人:DNA假设与生物物种概念的混淆
J Mol Evol. 2016 Aug;83(1-2):78-87. doi: 10.1007/s00239-016-9755-7. Epub 2016 Aug 12.
4
A mitochondrial genome sequence of a hominin from Sima de los Huesos.尼安德特人线粒体基因组序列来自西玛德洛斯胡埃斯。
Nature. 2014 Jan 16;505(7483):403-6. doi: 10.1038/nature12788. Epub 2013 Dec 4.
5
Neandertal roots: Cranial and chronological evidence from Sima de los Huesos.尼安德特人的根源:来自西玛德洛斯胡埃斯的颅骨和年代证据。
Science. 2014 Jun 20;344(6190):1358-63. doi: 10.1126/science.1253958.
6
Comparing the Boxgrove and Atapuerca (Sima de los Huesos) human fossils: Do they represent distinct paleodemes?比较博克斯格罗夫和阿塔普埃斯卡(希梅罗骨洞)人类化石:它们是否代表不同的古生物地理区系?
J Hum Evol. 2022 Nov;172:103253. doi: 10.1016/j.jhevol.2022.103253. Epub 2022 Sep 23.
7
New bracketing luminescence ages constrain the Sima de los Huesos hominin fossils (Atapuerca, Spain) to MIS 12.新的套取发光测年结果将西玛德洛斯胡埃斯人类化石(西班牙阿塔普埃尔卡)的年代确定在 MIS 12 期。
J Hum Evol. 2019 Jun;131:76-95. doi: 10.1016/j.jhevol.2018.12.003. Epub 2019 Apr 10.
8
Mining ancient microbiomes using selective enrichment of damaged DNA molecules.利用受损 DNA 分子的选择性富集来挖掘古代微生物组。
BMC Genomics. 2020 Jun 26;21(1):432. doi: 10.1186/s12864-020-06820-7.
9
The Sima de los Huesos crania (Sierra de Atapuerca, Spain). A comparative study.西玛德洛斯休索斯颅骨(西班牙阿塔普尔卡山脉)。一项比较研究。
J Hum Evol. 1997 Aug-Sep;33(2-3):219-81. doi: 10.1006/jhev.1997.0133.
10
Morphological description and comparison of the dental remains from Atapuerca-Sima de los Huesos site (Spain).阿塔普埃斯卡-西玛德洛斯胡埃斯遗址(西班牙)牙齿化石的形态描述和比较。
J Hum Evol. 2012 Jan;62(1):7-58. doi: 10.1016/j.jhevol.2011.08.007. Epub 2011 Nov 25.

引用本文的文献

1
The genomic footprints of migration: how ancient DNA reveals our history of mobility.迁徙的基因组印记:古代DNA如何揭示我们的迁徙历史。
Genome Biol. 2025 Jul 16;26(1):206. doi: 10.1186/s13059-025-03664-w.
2
Genomic data from the extinct California brown bear suggests a source population for reintroduction to California.已灭绝的加州棕熊的基因组数据为重新引入加州提供了一个源种群。
J Hered. 2025 Jul 21;116(4):422-434. doi: 10.1093/jhered/esaf018.
3
Statistical Distributions of Genome Assemblies Reveal Random Effects in Ancient Viral DNA Reconstructions.

本文引用的文献

1
snpAD: an ancient DNA genotype caller.snpAD:一种古老的 DNA 基因型调用器。
Bioinformatics. 2018 Dec 15;34(24):4165-4171. doi: 10.1093/bioinformatics/bty507.
2
Reconstructing the genetic history of late Neanderthals.重建晚期尼安德特人的遗传史。
Nature. 2018 Mar 29;555(7698):652-656. doi: 10.1038/nature26151. Epub 2018 Mar 21.
3
Ancient genomes show social and reproductive behavior of early Upper Paleolithic foragers.古代基因组揭示了旧石器时代晚期采集者的社会和生殖行为。
基因组组装的统计分布揭示了古代病毒DNA重建中的随机效应。
Viruses. 2025 Jan 30;17(2):195. doi: 10.3390/v17020195.
4
Earliest modern human genomes constrain timing of Neanderthal admixture.最早的现代人类基因组限制了尼安德特人基因渗入的时间。
Nature. 2025 Feb;638(8051):711-717. doi: 10.1038/s41586-024-08420-x. Epub 2024 Dec 12.
5
Improving data archiving practices in ancient genomics.改进古基因组学的数据归档实践。
Sci Data. 2024 Jul 10;11(1):754. doi: 10.1038/s41597-024-03563-y.
6
Unravelling reference bias in ancient DNA datasets.揭示古代DNA数据集中的参考偏差
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae436.
7
Developing the Protocol Infrastructure for DNA Sequencing Natural History Collections.开发用于DNA测序自然历史标本馆的协议基础设施。
Biodivers Data J. 2023 Oct 27;11:e102317. doi: 10.3897/BDJ.11.e102317. eCollection 2023.
8
Genome sequences of 36,000- to 37,000-year-old modern humans at Buran-Kaya III in Crimea.克里米亚布伦卡亚 III 洞穴中 36000 至 37000 年前现代人类的基因组序列。
Nat Ecol Evol. 2023 Dec;7(12):2160-2172. doi: 10.1038/s41559-023-02211-9. Epub 2023 Oct 23.
9
MTaxi: A comparative tool for taxon identification of ultra low coverage ancient genomes.MTaxi:一种用于超低覆盖度古代基因组分类鉴定的比较工具。
Open Res Eur. 2023 Sep 29;2:100. doi: 10.12688/openreseurope.14936.3. eCollection 2022.
10
Deep-time paleogenomics and the limits of DNA survival.古基因组学与 DNA 存活极限的深度解析。
Science. 2023 Oct 6;382(6666):48-53. doi: 10.1126/science.adh7943. Epub 2023 Oct 5.
Science. 2017 Nov 3;358(6363):659-662. doi: 10.1126/science.aao1807. Epub 2017 Oct 5.
4
A high-coverage Neandertal genome from Vindija Cave in Croatia.来自克罗地亚温迪加洞穴的高覆盖率尼安德特人基因组。
Science. 2017 Nov 3;358(6363):655-658. doi: 10.1126/science.aao1887. Epub 2017 Oct 5.
5
Southern African ancient genomes estimate modern human divergence to 350,000 to 260,000 years ago.南部非洲古代人类基因组估计现代人类的分化时间在 35 万至 26 万年以前。
Science. 2017 Nov 3;358(6363):652-655. doi: 10.1126/science.aao6266. Epub 2017 Sep 28.
6
Reconstructing Prehistoric African Population Structure.重建史前非洲人口结构。
Cell. 2017 Sep 21;171(1):59-71.e21. doi: 10.1016/j.cell.2017.08.049.
7
Extending the spectrum of DNA sequences retrieved from ancient bones and teeth.扩展从古代骨骼和牙齿中获取的DNA序列的范围。
Genome Res. 2017 Jul;27(7):1230-1237. doi: 10.1101/gr.219675.116. Epub 2017 Apr 13.
8
gargammel: a sequence simulator for ancient DNA.加加麦尔:一种用于古代DNA的序列模拟器。
Bioinformatics. 2017 Feb 15;33(4):577-579. doi: 10.1093/bioinformatics/btw670.
9
Early farmers from across Europe directly descended from Neolithic Aegeans.来自欧洲各地的早期农民是新石器时代爱琴海人的直系后裔。
Proc Natl Acad Sci U S A. 2016 Jun 21;113(25):6886-91. doi: 10.1073/pnas.1523951113. Epub 2016 Jun 6.
10
Nuclear DNA sequences from the Middle Pleistocene Sima de los Huesos hominins.中更新世西语人骨化石的核 DNA 序列。
Nature. 2016 Mar 24;531(7595):504-7. doi: 10.1038/nature17405. Epub 2016 Mar 14.