• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SAGA(简化全基因组关联分析):一种使全基因组关联研究普及化的用户友好型流程。

SAGA (Simplified Association Genomewide Analyses): a user-friendly Pipeline to Democratize Genome-Wide Association Studies.

作者信息

Cieza Basilio, Pandey Neetesh, Ruhela Vivek, Ali Sarwan, Tosto Giuseppe

机构信息

Taub Institute for Research on Alzheimer's Disease and the Aging Brain, Vagelos College of Physicians and Surgeons, Columbia University. 630 West 168 Street, New York, NY 10032, USA.

The Gertrude H. Sergievsky Center, Vagelos College of Physicians and Surgeons, Columbia University. 630 West 168 Street, New York, NY 10032, USA.

出版信息

bioRxiv. 2025 Aug 29:2025.08.25.672146. doi: 10.1101/2025.08.25.672146.

DOI:10.1101/2025.08.25.672146
PMID:40909723
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC12407738/
Abstract

Genome-wide association studies (GWAS) have enabled clinicians and researchers to identify genetic variants linked to complex traits and diseases(1). However, conducting GWAS remains technically challenging without bioinformatics expertise due to required data preprocessing, software installation, and analysis scripting (2,3). SAGA is a BASH-based, open-source, fully automated pipeline that integrates three widely adopted tools-PLINK(4), GMMAT(5), and SAIGE(6)-for accessible, robust, and reproducible GWAS. After installation, users only provide standard genotype and phenotype files. The pipeline automates preprocessing, association testing, and visualization, outputting summary statistics, Manhattan plots, and quantile-quantile plot. SAGA enables robust GWAS for users with no scripting experience, expanding access to complex genetic analyses.

摘要

全基因组关联研究(GWAS)使临床医生和研究人员能够识别与复杂性状和疾病相关的基因变异(1)。然而,由于需要进行数据预处理、软件安装和分析脚本编写,在没有生物信息学专业知识的情况下进行GWAS在技术上仍然具有挑战性(2,3)。SAGA是一个基于BASH的开源全自动流程,它集成了三个广泛采用的工具——PLINK(4)、GMMAT(5)和SAIGE(6)——用于可访问、稳健且可重复的GWAS。安装后,用户只需提供标准的基因型和表型文件。该流程会自动进行预处理、关联测试和可视化,输出汇总统计信息、曼哈顿图和分位数-分位数图。SAGA使没有脚本编写经验的用户也能进行稳健的GWAS,扩大了复杂基因分析的可及性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0cb5/12407738/255d86741888/nihpp-2025.08.25.672146v1-f0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0cb5/12407738/6347e5baf5f7/nihpp-2025.08.25.672146v1-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0cb5/12407738/255d86741888/nihpp-2025.08.25.672146v1-f0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0cb5/12407738/6347e5baf5f7/nihpp-2025.08.25.672146v1-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/0cb5/12407738/255d86741888/nihpp-2025.08.25.672146v1-f0002.jpg

相似文献

1
SAGA (Simplified Association Genomewide Analyses): a user-friendly Pipeline to Democratize Genome-Wide Association Studies.SAGA(简化全基因组关联分析):一种使全基因组关联研究普及化的用户友好型流程。
bioRxiv. 2025 Aug 29:2025.08.25.672146. doi: 10.1101/2025.08.25.672146.
2
RNA-SeqEZPZ: A Point-and-Click Pipeline for Comprehensive Transcriptomics Analysis with Interactive Visualizations.RNA-SeqEZPZ:一个通过交互式可视化进行全面转录组学分析的点击式流程。
bioRxiv. 2024 Dec 23:2024.12.20.629844. doi: 10.1101/2024.12.20.629844.
3
GRAPEVNE - Graphical Analytical Pipeline Development Environment for Infectious Diseases.GRAPEVNE - 传染病图形分析管道开发环境
Wellcome Open Res. 2025 May 27;10:279. doi: 10.12688/wellcomeopenres.23824.1. eCollection 2025.
4
It's a wrap: deriving distinct discoveries with FDR control after a GWAS pipeline.大功告成:在全基因组关联研究流程之后通过错误发现率控制得出不同的发现。
bioRxiv. 2025 Jul 9:2025.06.05.658138. doi: 10.1101/2025.06.05.658138.
5
Off-site processing of data-dependent and data-independent acquisition shotgun proteomics data with MASSyPupX.使用MASSyPupX对数据依赖型和数据独立型采集的鸟枪法蛋白质组学数据进行异地处理。
J Proteomics. 2025 Aug 5;321:105494. doi: 10.1016/j.jprot.2025.105494.
6
Assessment of the functionality and usability of open-source rare variant analysis pipelines.开源罕见变异分析流程的功能与可用性评估。
Brief Bioinform. 2025 Feb 5;26(1). doi: 10.1093/bib/bbaf044.
7
Prescription of Controlled Substances: Benefits and Risks管制药品的处方:益处与风险
8
SCOPA and META-SCOPA: software for the analysis and aggregation of genome-wide association studies of multiple correlated phenotypes.SCOPA和META-SCOPA:用于分析和汇总多个相关表型的全基因组关联研究的软件。
BMC Bioinformatics. 2017 Jan 11;18(1):25. doi: 10.1186/s12859-016-1437-3.
9
FarmGTEx TWAS-server: An Interactive Web Server for Customized TWAS Analysis.FarmGTEx全转录组关联研究服务器:用于定制化全转录组关联研究分析的交互式网络服务器。
Genomics Proteomics Bioinformatics. 2025 Feb 11. doi: 10.1093/gpbjnl/qzaf006.
10
A benchmark study on current GWAS models in admixed populations.混合人群中当前 GWAS 模型的基准研究。
Brief Bioinform. 2023 Nov 22;25(1). doi: 10.1093/bib/bbad437.

本文引用的文献

1
Introducing GWAStic: a user-friendly, cross-platform solution for genome-wide association studies and genomic prediction.介绍GWAStic:一种用于全基因组关联研究和基因组预测的用户友好型跨平台解决方案。
Bioinform Adv. 2024 Nov 12;4(1):vbae177. doi: 10.1093/bioadv/vbae177. eCollection 2024.
2
COSGAP: COntainerized Statistical Genetics Analysis Pipelines.COSGAP:容器化统计遗传学分析流程
Bioinform Adv. 2024 May 9;4(1):vbae067. doi: 10.1093/bioadv/vbae067. eCollection 2024.
3
Performing highly parallelized and reproducible GWAS analysis on biobank-scale data.
对生物样本库规模的数据进行高度并行且可重复的全基因组关联研究(GWAS)分析。
NAR Genom Bioinform. 2024 Feb 7;6(1):lqae015. doi: 10.1093/nargab/lqae015. eCollection 2024 Mar.
4
nf-gwas-pipeline: A Nextflow Genome-Wide Association Study Pipeline.nf-gwas流程:一种用于全基因组关联研究的Nextflow流程。
J Open Source Softw. 2021;6(59). doi: 10.21105/joss.02957. Epub 2021 Mar 2.
5
Efficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies.在大规模的遗传关联研究中,有效地控制病例-对照不平衡和样本相关性。
Nat Genet. 2018 Sep;50(9):1335-1341. doi: 10.1038/s41588-018-0184-y. Epub 2018 Aug 13.
6
Control for Population Structure and Relatedness for Binary Traits in Genetic Association Studies via Logistic Mixed Models.通过逻辑混合模型在遗传关联研究中对二元性状的群体结构和相关性进行控制。
Am J Hum Genet. 2016 Apr 7;98(4):653-66. doi: 10.1016/j.ajhg.2016.02.012. Epub 2016 Mar 24.
7
Bioinformatics challenges for genome-wide association studies.全基因组关联研究中的生物信息学挑战。
Bioinformatics. 2010 Feb 15;26(4):445-55. doi: 10.1093/bioinformatics/btp713. Epub 2010 Jan 6.
8
PLINK: a tool set for whole-genome association and population-based linkage analyses.PLINK:一个用于全基因组关联分析和基于群体的连锁分析的工具集。
Am J Hum Genet. 2007 Sep;81(3):559-75. doi: 10.1086/519795. Epub 2007 Jul 25.