• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GTQC:自动化基因分型阵列质量控制与报告

GTQC: Automated Genotyping Array Quality Control and Report.

作者信息

Zhao Shilin, Jiang Limin, Yu Hui, Guo Yan

机构信息

Department of Biostatistics, Vanderbilt University Medical Center, Nashville, TN.

Department Internal Medicine, University of New Mexico, Comprehensive Cancer Center, Albuquerque, NM.

出版信息

J Genomics. 2022 Feb 14;10:39-44. doi: 10.7150/jgen.69860. eCollection 2022.

DOI:10.7150/jgen.69860
PMID:35300047
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8922302/
Abstract

Genotyping array is the most economical approach for conducting large-scale genome-wide genetic association studies. Thorough quality control is key to generating high integrity genotyping data and robust results. Quality control of genotyping array is generally a complicated process, as it requires intensive manual labor in implementing the established protocols and curating a comprehensive quality report. There is an urgent need to reduce manual intervention via an automated quality control process. Based on previously established protocols and strategies, we developed an R package GTQC (GenoTyping Quality Control) to automate a majority of the quality control steps for general array genotyping data. GTQC covers a comprehensive spectrum of genotype data quality metrics and produces a detailed HTML report comprising tables and figures. Here, we describe the concepts underpinning GTQC and demonstrate its effectiveness using a real genotyping dataset. R package GTQC streamlines a majority of the quality control steps and produces a detailed HTML report on a plethora of quality control metrics, thus enabling a swift and rigorous data quality inspection prior to downstream GWAS and related analyses. By significantly cutting down on the time on genotyping quality control procedures, GTQC ensures maximum utilization of available resources and minimizes waste and inefficient allocation of manual efforts. GTQC tool can be accessed at https://github.com/slzhao/GTQC.

摘要

基因分型阵列是进行大规模全基因组遗传关联研究最经济的方法。全面的质量控制是生成高完整性基因分型数据和可靠结果的关键。基因分型阵列的质量控制通常是一个复杂的过程,因为在执行既定方案和整理全面的质量报告时需要大量的人工操作。迫切需要通过自动化质量控制流程来减少人工干预。基于先前建立的方案和策略,我们开发了一个R包GTQC(基因分型质量控制),以自动化一般阵列基因分型数据的大部分质量控制步骤。GTQC涵盖了广泛的基因型数据质量指标,并生成一份包含表格和图表的详细HTML报告。在这里,我们描述了GTQC的基本概念,并使用一个实际的基因分型数据集展示了它的有效性。R包GTQC简化了大部分质量控制步骤,并生成一份关于大量质量控制指标的详细HTML报告,从而能够在下游全基因组关联研究及相关分析之前进行快速而严格的数据质量检查。通过大幅减少基因分型质量控制程序的时间,GTQC确保了可用资源的最大利用,并最大限度地减少了人工精力的浪费和低效分配。可通过https://github.com/slzhao/GTQC访问GTQC工具。

相似文献

1
GTQC: Automated Genotyping Array Quality Control and Report.GTQC:自动化基因分型阵列质量控制与报告
J Genomics. 2022 Feb 14;10:39-44. doi: 10.7150/jgen.69860. eCollection 2022.
2
The COPILOT Raw Illumina Genotyping QC Protocol.COPILOT原始Illumina基因分型质量控制方案。
Curr Protoc. 2022 Apr;2(4):e373. doi: 10.1002/cpz1.373.
3
Seq2Sat and SatAnalyzer toolkit: Towards comprehensive microsatellite genotyping from sequencing data.Seq2Sat 和 SatAnalyzer 工具包:从测序数据中实现全面的微卫星基因分型。
Mol Ecol Resour. 2024 Apr;24(3):e13929. doi: 10.1111/1755-0998.13929. Epub 2024 Jan 30.
4
SNPQC--an R pipeline for quality control of Illumina SNP genotyping array data.SNPQC——用于Illumina SNP基因分型阵列数据质量控制的R流程
Anim Genet. 2014 Oct;45(5):758-61. doi: 10.1111/age.12198. Epub 2014 Jul 18.
5
argyle: An R Package for Analysis of Illumina Genotyping Arrays.阿盖尔:一个用于分析Illumina基因分型阵列的R软件包。
G3 (Bethesda). 2015 Dec 18;6(2):281-6. doi: 10.1534/g3.115.023739.
6
Folic acid supplementation and malaria susceptibility and severity among people taking antifolate antimalarial drugs in endemic areas.在流行地区,服用抗叶酸抗疟药物的人群中,叶酸补充剂与疟疾易感性和严重程度的关系。
Cochrane Database Syst Rev. 2022 Feb 1;2(2022):CD014217. doi: 10.1002/14651858.CD014217.
7
Strategies for processing and quality control of Illumina genotyping arrays.Illumina 基因分型芯片的处理和质量控制策略。
Brief Bioinform. 2018 Sep 28;19(5):765-775. doi: 10.1093/bib/bbx012.
8
SureTypeSCR: R package for rapid quality control and genotyping of SNP arrays from single cells.SureTypeSCR:用于对单细胞SNP阵列进行快速质量控制和基因分型的R包。
F1000Res. 2021 Sep 21;10:953. doi: 10.12688/f1000research.53287.1. eCollection 2021.
9
Development of an integrated 200K SNP genotyping array and application for genetic mapping, genome assembly improvement and genome wide association studies in pear (Pyrus).开发一种集成的 200K SNP 基因分型阵列,并将其应用于梨(Pyrus)的遗传图谱构建、基因组组装改进和全基因组关联研究。
Plant Biotechnol J. 2019 Aug;17(8):1582-1594. doi: 10.1111/pbi.13085. Epub 2019 Feb 17.
10
Illumina human exome genotyping array clustering and quality control.Illumina人类外显子基因分型阵列聚类与质量控制
Nat Protoc. 2014 Nov;9(11):2643-62. doi: 10.1038/nprot.2014.174. Epub 2014 Oct 16.

引用本文的文献

1
Investigating the causal role of serum metabolites in substance use disorder risk: a study integrating Mendelian randomization and synthesis analysis.探究血清代谢物在物质使用障碍风险中的因果作用:一项整合孟德尔随机化与综合分析的研究
Discov Ment Health. 2025 Aug 19;5(1):126. doi: 10.1007/s44192-025-00275-6.

本文引用的文献

1
Global Autozygosity Is Associated with Cancer Risk, Mutational Signature and Prognosis.全基因组纯合性与癌症风险、突变特征及预后相关。
Cancers (Basel). 2020 Dec 4;12(12):3646. doi: 10.3390/cancers12123646.
2
Alternative Applications of Genotyping Array Data Using Multivariant Methods.采用多变量方法的基因分型阵列数据的其他应用。
Trends Genet. 2020 Nov;36(11):857-867. doi: 10.1016/j.tig.2020.07.006. Epub 2020 Aug 6.
3
Pedigree reconstruction from poor quality genotype data.从低质量基因型数据中进行家系重建。
Heredity (Edinb). 2019 Jun;122(6):719-728. doi: 10.1038/s41437-018-0178-7. Epub 2019 Jan 10.
4
Peripheral Blood Mitochondrial DNA Copy Number Obtained From Genome-Wide Genotype Data Is Associated With Neurocognitive Impairment in Persons With Chronic HIV Infection.从全基因组基因型数据中获得的外周血线粒体 DNA 拷贝数与慢性 HIV 感染患者的神经认知障碍有关。
J Acquir Immune Defic Syndr. 2019 Apr 1;80(4):e95-e102. doi: 10.1097/QAI.0000000000001930.
5
Cancer-specific expression quantitative loci are affected by expression dysregulation.癌症特异性表达数量性状位点受表达失调影响。
Brief Bioinform. 2020 Jan 17;21(1):338-347. doi: 10.1093/bib/bby108.
6
Pancan-meQTL: a database to systematically evaluate the effects of genetic variants on methylation in human cancer.泛癌甲基化 QTL(pan-cancer methylation quantitative trait loci,panCan-meQTL)数据库:用于系统评估遗传变异对人类癌症中甲基化影响的数据库。
Nucleic Acids Res. 2019 Jan 8;47(D1):D1066-D1072. doi: 10.1093/nar/gky814.
7
Quality and concordance of genotyping array data of 12,064 samples from 5840 cancer patients.12064 个来自 5840 名癌症患者样本的基因分型阵列数据的质量和一致性。
Genomics. 2019 Jul;111(4):950-957. doi: 10.1016/j.ygeno.2018.06.001. Epub 2018 Jun 11.
8
PancanQTL: systematic identification of cis-eQTLs and trans-eQTLs in 33 cancer types.泛癌 cis-eQTLs 和 trans-eQTLs 综合鉴定分析(PancanQTL:系统性鉴定 33 种癌症类型中的 cis-eQTLs 和 trans-eQTLs)
Nucleic Acids Res. 2018 Jan 4;46(D1):D971-D976. doi: 10.1093/nar/gkx861.
9
Estimating relative mitochondrial DNA copy number using high throughput sequencing data.利用高通量测序数据估算相对线粒体DNA拷贝数
Genomics. 2017 Oct;109(5-6):457-462. doi: 10.1016/j.ygeno.2017.07.002. Epub 2017 Jul 19.
10
StrandScript: evaluation of Illumina genotyping array design and strand correction.StrandScript:评估 Illumina 基因分型阵列设计和链校正。
Bioinformatics. 2017 Aug 1;33(15):2399-2401. doi: 10.1093/bioinformatics/btx186.