• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用生成对抗网络从低深度 ONT 测序数据中进行基因组变异调用。

Using generative adversarial networks for genome variant calling from low depth ONT sequencing data.

机构信息

City Brain Lab, DAMO Academy, Alibaba Group, Hangzhou, China.

Department of Computing, The Hong Kong Polytechnic University, Hung Hom, Hong Kong.

出版信息

Sci Rep. 2022 May 30;12(1):8725. doi: 10.1038/s41598-022-12346-7.

DOI:10.1038/s41598-022-12346-7
PMID:35637238
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9151722/
Abstract

Genome variant calling is a challenging yet critical task for subsequent studies. Existing methods almost rely on high depth DNA sequencing data. Performance on low depth data drops a lot. Using public Oxford Nanopore (ONT) data of human being from the Genome in a Bottle (GIAB) Consortium, we trained a generative adversarial network for low depth variant calling. Our method, noted as LDV-Caller, can project high depth sequencing information from low depth data. It achieves 94.25% F1 score on low depth data, while the F1 score of the state-of-the-art method on two times higher depth data is 94.49%. By doing so, the price of genome-wide sequencing examination can reduce deeply. In addition, we validated the trained LDV-Caller model on 157 public Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) samples. The mean sequencing depth of these samples is 2982. The LDV-Caller yields 92.77% F1 score using only 22x sequencing depth, which demonstrates our method has potential to analyze different species with only low depth sequencing data.

摘要

基因组变异调用是后续研究中具有挑战性但至关重要的任务。现有的方法几乎都依赖于高深度 DNA 测序数据。在低深度数据上的性能会大幅下降。我们使用基因组瓶装物 (GIAB) 联盟的公开牛津纳米孔 (ONT) 人类数据,训练了一个用于低深度变异调用的生成对抗网络。我们的方法,称为 LDV-Caller,可以从低深度数据中预测高深度测序信息。它在低深度数据上实现了 94.25%的 F1 分数,而最先进方法在两倍更高深度数据上的 F1 分数为 94.49%。通过这样做,可以大大降低全基因组测序检测的价格。此外,我们在 157 个公共严重急性呼吸综合征冠状病毒 2 (SARS-CoV-2) 样本上验证了训练好的 LDV-Caller 模型。这些样本的平均测序深度为 2982。仅使用 22x 测序深度,LDV-Caller 产生了 92.77%的 F1 分数,这表明我们的方法有可能仅使用低深度测序数据分析不同物种。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/25062a99e488/41598_2022_12346_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/5d6ce9a9ea7d/41598_2022_12346_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/4b5f7d64047c/41598_2022_12346_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/da75ab5d8cd8/41598_2022_12346_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/0adad8ef7529/41598_2022_12346_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/25062a99e488/41598_2022_12346_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/5d6ce9a9ea7d/41598_2022_12346_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/4b5f7d64047c/41598_2022_12346_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/da75ab5d8cd8/41598_2022_12346_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/0adad8ef7529/41598_2022_12346_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/26b4/9151722/25062a99e488/41598_2022_12346_Fig5_HTML.jpg

相似文献

1
Using generative adversarial networks for genome variant calling from low depth ONT sequencing data.利用生成对抗网络从低深度 ONT 测序数据中进行基因组变异调用。
Sci Rep. 2022 May 30;12(1):8725. doi: 10.1038/s41598-022-12346-7.
2
Analytical validity of nanopore sequencing for rapid SARS-CoV-2 genome analysis.纳米孔测序快速分析 SARS-CoV-2 基因组的分析有效性。
Nat Commun. 2020 Dec 9;11(1):6272. doi: 10.1038/s41467-020-20075-6.
3
Evaluation of the Available Variant Calling Tools for Oxford Nanopore Sequencing in Breast Cancer.评估适用于乳腺癌牛津纳米孔测序的变异调用工具。
Genes (Basel). 2022 Sep 3;13(9):1583. doi: 10.3390/genes13091583.
4
Assessment of two-pool multiplex long-amplicon nanopore sequencing of SARS-CoV-2.评估 SARS-CoV-2 两池复用长扩增子纳米孔测序。
J Med Virol. 2022 Jan;94(1):327-334. doi: 10.1002/jmv.27336. Epub 2021 Sep 23.
5
Boosting variant-calling performance with multi-platform sequencing data using Clair3-MP.使用 Clair3-MP 结合多平台测序数据提高变异calling 性能。
BMC Bioinformatics. 2023 Aug 3;24(1):308. doi: 10.1186/s12859-023-05434-6.
6
Longshot enables accurate variant calling in diploid genomes from single-molecule long read sequencing.Longshot 可通过单分子长读测序对二倍体基因组进行准确的变异调用。
Nat Commun. 2019 Oct 11;10(1):4660. doi: 10.1038/s41467-019-12493-y.
7
Rescuing low frequency variants within intra-host viral populations directly from Oxford Nanopore sequencing data.从牛津纳米孔测序数据中直接拯救宿主内病毒群体中的低频变异体。
Nat Commun. 2022 Mar 14;13(1):1321. doi: 10.1038/s41467-022-28852-1.
8
Assessing single nucleotide variant detection and genotype calling on whole-genome sequenced individuals.评估全基因组测序个体中单核苷酸变异检测和基因型调用。
Bioinformatics. 2014 Jun 15;30(12):1707-13. doi: 10.1093/bioinformatics/btu067. Epub 2014 Feb 19.
9
NanoVar: accurate characterization of patients' genomic structural variants using low-depth nanopore sequencing.NanoVar:使用低深度纳米孔测序准确表征患者的基因组结构变异。
Genome Biol. 2020 Mar 3;21(1):56. doi: 10.1186/s13059-020-01968-7.
10
Using genotype array data to compare multi- and single-sample variant calls and improve variant call sets from deep coverage whole-genome sequencing data.利用基因型阵列数据比较多样本和单样本变异检测结果,并改进来自深度覆盖全基因组测序数据的变异检测集。
Bioinformatics. 2017 Apr 15;33(8):1147-1153. doi: 10.1093/bioinformatics/btw786.

引用本文的文献

1
The Use of AI for Phenotype-Genotype Mapping.人工智能在表型-基因型映射中的应用。
Methods Mol Biol. 2025;2952:369-410. doi: 10.1007/978-1-0716-4690-8_21.
2
Genome analysis through image processing with deep learning models.基于深度学习模型的图像处理基因组分析。
J Hum Genet. 2024 Oct;69(10):519-525. doi: 10.1038/s10038-024-01275-0. Epub 2024 Jul 31.
3
Performance analysis of conventional and AI-based variant callers using short and long reads.使用短读长读对常规和基于人工智能的变异调用程序进行性能分析。

本文引用的文献

1
Genetic Variation and Evolution of the 2019 Novel Coronavirus.新型冠状病毒的遗传变异与进化
Public Health Genomics. 2021;24(1-2):54-66. doi: 10.1159/000513530. Epub 2021 Jan 6.
2
Analytical validity of nanopore sequencing for rapid SARS-CoV-2 genome analysis.纳米孔测序快速分析 SARS-CoV-2 基因组的分析有效性。
Nat Commun. 2020 Dec 9;11(1):6272. doi: 10.1038/s41467-020-20075-6.
3
Longshot enables accurate variant calling in diploid genomes from single-molecule long read sequencing.Longshot 可通过单分子长读测序对二倍体基因组进行准确的变异调用。
BMC Bioinformatics. 2023 Dec 14;24(1):472. doi: 10.1186/s12859-023-05596-3.
4
Nanopore sequencing technology and its applications.纳米孔测序技术及其应用。
MedComm (2020). 2023 Jul 10;4(4):e316. doi: 10.1002/mco2.316. eCollection 2023 Aug.
Nat Commun. 2019 Oct 11;10(1):4660. doi: 10.1038/s41467-019-12493-y.
4
A new era of long-read sequencing for cancer genomics.癌症基因组学的长读测序新纪元。
J Hum Genet. 2020 Jan;65(1):3-10. doi: 10.1038/s10038-019-0658-5. Epub 2019 Sep 2.
5
An open resource for accurately benchmarking small variant and reference calls.用于准确基准测试小型变体和参考调用的开放资源。
Nat Biotechnol. 2019 May;37(5):561-566. doi: 10.1038/s41587-019-0074-6. Epub 2019 Apr 1.
6
Deep convolutional neural networks for accurate somatic mutation detection.深度卷积神经网络用于准确的体细胞突变检测。
Nat Commun. 2019 Mar 4;10(1):1041. doi: 10.1038/s41467-019-09027-x.
7
A multi-task convolutional deep neural network for variant calling in single molecule sequencing.一种用于单分子测序中变异调用的多任务卷积深度神经网络。
Nat Commun. 2019 Mar 1;10(1):998. doi: 10.1038/s41467-019-09025-z.
8
A universal SNP and small-indel variant caller using deep neural networks.使用深度神经网络的通用 SNP 和小插入缺失变体调用器。
Nat Biotechnol. 2018 Nov;36(10):983-987. doi: 10.1038/nbt.4235. Epub 2018 Sep 24.
9
A deep convolutional neural network approach for predicting phenotypes from genotypes.一种基于深度卷积神经网络的基因型到表型预测方法。
Planta. 2018 Nov;248(5):1307-1318. doi: 10.1007/s00425-018-2976-9. Epub 2018 Aug 12.
10
Nanopore sequencing and assembly of a human genome with ultra-long reads.纳米孔测序和超长读长组装人类基因组。
Nat Biotechnol. 2018 Apr;36(4):338-345. doi: 10.1038/nbt.4060. Epub 2018 Jan 29.