Suppr超能文献

BiU-Net:一种用于基因型插补的基于生物学信息的U-Net

BiU-Net: A Biologically Informed U-Net for Genotype Imputation.

作者信息

Huang Lei, Su Kuan-Jui, Song Meng, Qiu Chuan, Gragert Loren, Deng Jeffrey, Luo Zhe, Tian Qing, Gong Ping, Shen Hui, Zhang Chaoyang, Deng Hong-Wen

机构信息

University of Southern Mississippi.

Tulane University.

出版信息

Res Sq. 2025 Aug 26:rs.3.rs-6797863. doi: 10.21203/rs.3.rs-6797863/v1.

Abstract

Missing genotypes reduce statistical power and hinder genome-wide association studies. While reference-based methods are popular, they struggle in complex regions and under population mismatch. Existing reference-free deep learning models show promise in addressing this issue but often fail to impute rare variants in small datasets. We propose BiU-Net, a biologically informed U-Net model that segments genotype data and encodes positional information to preserve the genomic context. Evaluated on the 1000 Genomes Project, Louisiana Osteoporosis Study, and Simons Genome Diversity Project datasets, BiU-Net outperformed Beagle and sparse convolutional denoising autoencoder in overall metrics and in metrics stratified by minor allele frequency.

摘要

缺失的基因型会降低统计效力并阻碍全基因组关联研究。虽然基于参考的方法很流行,但它们在复杂区域和群体不匹配的情况下会遇到困难。现有的无参考深度学习模型在解决这个问题方面显示出了前景,但在小数据集中往往无法估算罕见变异。我们提出了BiU-Net,这是一种具有生物学信息的U-Net模型,它对基因型数据进行分割并编码位置信息以保留基因组背景。在千人基因组计划、路易斯安那骨质疏松症研究和西蒙斯基因组多样性计划数据集上进行评估时,BiU-Net在总体指标以及按次要等位基因频率分层的指标方面均优于Beagle和稀疏卷积去噪自动编码器。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/1585/12408042/0d21f8992cee/nihpp-rs6797863v1-f0002.jpg

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验