• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

金冲浪者2(Gs2):一种用于全基因组关联研究分析和可视化的综合工具。

Goldsurfer2 (Gs2): a comprehensive tool for the analysis and visualization of genome wide association studies.

作者信息

Pettersson Fredrik, Morris Andrew P, Barnes Michael R, Cardon Lon R

机构信息

Dept Bioinformatics, Wellcome Trust Centre, Oxford, UK.

出版信息

BMC Bioinformatics. 2008 Mar 4;9:138. doi: 10.1186/1471-2105-9-138.

DOI:10.1186/1471-2105-9-138
PMID:18318908
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2323971/
Abstract

BACKGROUND

Genome wide association (GWA) studies are now being widely undertaken aiming to find the link between genetic variations and common diseases. Ideally, a well-powered GWA study will involve the measurement of hundreds of thousands of single nucleotide polymorphisms (SNPs) in thousands of individuals. The sheer volume of data generated by these experiments creates very high analytical demands. There are a number of important steps during the analysis of such data, many of which may present severe bottlenecks. The data need to be imported and reviewed to perform initial quality control (QC) before proceeding to association testing. Evaluation of results may involve further statistical analysis, such as permutation testing, or further QC of associated markers, for example, reviewing raw genotyping intensities. Finally significant associations need to be prioritised using functional and biological interpretation methods, browsing available biological annotation, pathway information and patterns of linkage disequilibrium (LD).

RESULTS

We have developed an interactive and user-friendly graphical application to be used in all steps in GWA projects from initial data QC and analysis to biological evaluation and validation of results. The program is implemented in Java and can be used on all platforms.

CONCLUSION

Very large data sets (e.g. 500 k markers and 5000 samples) can be quality assessed, rapidly analysed and integrated with genomic sequence information. Candidate SNPs can be selected and functionally evaluated.

摘要

背景

全基因组关联(GWA)研究目前正在广泛开展,旨在寻找基因变异与常见疾病之间的联系。理想情况下,一项强大的GWA研究将涉及对数千个体中的数十万个单核苷酸多态性(SNP)进行测量。这些实验产生的数据量极大,对分析提出了很高的要求。在此类数据分析过程中有许多重要步骤,其中许多可能成为严重的瓶颈。在进行关联测试之前,需要导入和审查数据以进行初始质量控制(QC)。结果评估可能涉及进一步的统计分析,如置换检验,或对相关标记进行进一步的QC,例如审查原始基因分型强度。最后,需要使用功能和生物学解释方法、浏览可用的生物学注释、通路信息和连锁不平衡(LD)模式,对显著关联进行优先级排序。

结果

我们开发了一个交互式且用户友好的图形应用程序,可用于GWA项目的所有步骤,从初始数据QC和分析到结果的生物学评估与验证。该程序用Java实现,可在所有平台上使用。

结论

非常大的数据集(例如50万个标记和5000个样本)可以进行质量评估、快速分析并与基因组序列信息整合。可以选择候选SNP并进行功能评估。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/e58b853dc7c8/1471-2105-9-138-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/3e476a30e7e0/1471-2105-9-138-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/8f0392722011/1471-2105-9-138-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/d957b6a71206/1471-2105-9-138-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/e58b853dc7c8/1471-2105-9-138-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/3e476a30e7e0/1471-2105-9-138-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/8f0392722011/1471-2105-9-138-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/d957b6a71206/1471-2105-9-138-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/123a/2323971/e58b853dc7c8/1471-2105-9-138-4.jpg

相似文献

1
Goldsurfer2 (Gs2): a comprehensive tool for the analysis and visualization of genome wide association studies.金冲浪者2(Gs2):一种用于全基因组关联研究分析和可视化的综合工具。
BMC Bioinformatics. 2008 Mar 4;9:138. doi: 10.1186/1471-2105-9-138.
2
JLIN: a java based linkage disequilibrium plotter.JLIN:一个基于Java的连锁不平衡绘图工具。
BMC Bioinformatics. 2006 Feb 9;7:60. doi: 10.1186/1471-2105-7-60.
3
MIDAS: software for analysis and visualisation of interallelic disequilibrium between multiallelic markers.MIDAS:用于分析和可视化多等位基因标记间等位基因不平衡的软件。
BMC Bioinformatics. 2006 Apr 27;7:227. doi: 10.1186/1471-2105-7-227.
4
lga972: a cross-platform application for optimizing LD studies using a genetic algorithm.LGA972:一款使用遗传算法优化连锁不平衡(LD)研究的跨平台应用程序。
Bioinformatics. 2004 Nov 22;20(17):3244-5. doi: 10.1093/bioinformatics/bth348. Epub 2004 Jun 4.
5
Plotting haplotype-specific linkage disequilibrium patterns by extended haplotype homozygosity.通过扩展单倍型纯合性绘制特定单倍型的连锁不平衡模式。
Bioinformatics. 2004 Mar 22;20(5):786-7. doi: 10.1093/bioinformatics/btg481. Epub 2004 Feb 5.
6
Haploview: analysis and visualization of LD and haplotype maps.Haploview:连锁不平衡(LD)和单倍型图谱的分析与可视化
Bioinformatics. 2005 Jan 15;21(2):263-5. doi: 10.1093/bioinformatics/bth457. Epub 2004 Aug 5.
7
MaGIC: a program to generate targeted marker sets for genome-wide association studies.MaGIC:一个用于生成全基因组关联研究靶向标记集的程序。
Biotechniques. 2004 Dec;37(6):996-9. doi: 10.2144/04376BIN03.
8
GOLDsurfer: three dimensional display of linkage disequilibrium.GOLDsurfer:连锁不平衡的三维显示
Bioinformatics. 2004 Nov 22;20(17):3241-3. doi: 10.1093/bioinformatics/bth341. Epub 2004 Jun 16.
9
An integrated system for genetic analysis.一种用于基因分析的集成系统。
BMC Bioinformatics. 2006 Apr 19;7:210. doi: 10.1186/1471-2105-7-210.
10
Multimarker analysis and imputation of multiple platform pooling-based genome-wide association studies.基于多平台混合样本的全基因组关联研究的多标记分析与推算
Bioinformatics. 2008 Sep 1;24(17):1896-902. doi: 10.1093/bioinformatics/btn333. Epub 2008 Jul 10.

引用本文的文献

1
Basic statistical analysis in genetic case-control studies.遗传病例对照研究中的基本统计学分析。
Nat Protoc. 2011 Feb;6(2):121-33. doi: 10.1038/nprot.2010.182. Epub 2011 Feb 3.
2
Data quality control in genetic case-control association studies.遗传病例对照关联研究中的数据质量控制。
Nat Protoc. 2010 Sep;5(9):1564-73. doi: 10.1038/nprot.2010.116. Epub 2010 Aug 26.
3
In silico QTL mapping of basal liver iron levels in inbred mouse strains.基于近交系小鼠的肝脏铁含量的 QTL 定位的计算机模拟。

本文引用的文献

1
PLINK: a tool set for whole-genome association and population-based linkage analyses.PLINK:一个用于全基因组关联分析和基于群体的连锁分析的工具集。
Am J Hum Genet. 2007 Sep;81(3):559-75. doi: 10.1086/519795. Epub 2007 Jul 25.
2
Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls.对14000例七种常见疾病患者及3000例共享对照进行全基因组关联研究。
Nature. 2007 Jun 7;447(7145):661-78. doi: 10.1038/nature05911.
3
A genome-wide association study identifies novel risk loci for type 2 diabetes.一项全基因组关联研究确定了2型糖尿病的新风险位点。
Physiol Genomics. 2011 Feb 11;43(3):136-47. doi: 10.1152/physiolgenomics.00025.2010. Epub 2010 Nov 9.
4
A quality control algorithm for filtering SNPs in genome-wide association studies.用于过滤全基因组关联研究中 SNPs 的质量控制算法。
Bioinformatics. 2010 Jul 15;26(14):1731-7. doi: 10.1093/bioinformatics/btq272. Epub 2010 May 25.
5
Marker selection for genetic case-control association studies.遗传病例对照关联研究的标记选择
Nat Protoc. 2009;4(5):743-52. doi: 10.1038/nprot.2009.38. Epub 2009 Apr 23.
Nature. 2007 Feb 22;445(7130):881-5. doi: 10.1038/nature05616. Epub 2007 Feb 11.
4
A genome-wide association study identifies IL23R as an inflammatory bowel disease gene.一项全基因组关联研究将白细胞介素23受体鉴定为炎症性肠病基因。
Science. 2006 Dec 1;314(5804):1461-3. doi: 10.1126/science.1135245. Epub 2006 Oct 26.
5
GENOMIZER: an integrated analysis system for genome-wide association data.基因分型器:一种用于全基因组关联数据的综合分析系统。
Hum Mutat. 2006 Jun;27(6):583-8. doi: 10.1002/humu.20306.
6
Whole-genome genotyping with the single-base extension assay.采用单碱基延伸分析法进行全基因组基因分型。
Nat Methods. 2006 Jan;3(1):31-3. doi: 10.1038/nmeth842.
7
A haplotype map of the human genome.人类基因组单倍型图谱。
Nature. 2005 Oct 27;437(7063):1299-320. doi: 10.1038/nature04226.
8
Population structure, differential bias and genomic control in a large-scale, case-control association study.一项大规模病例对照关联研究中的群体结构、差异偏倚与基因组控制
Nat Genet. 2005 Nov;37(11):1243-6. doi: 10.1038/ng1653. Epub 2005 Oct 9.
9
Recent developments in genomewide association scans: a workshop summary and review.全基因组关联扫描的最新进展:研讨会总结与综述
Am J Hum Genet. 2005 Sep;77(3):337-45. doi: 10.1086/432962. Epub 2005 Aug 1.
10
Genotyping over 100,000 SNPs on a pair of oligonucleotide arrays.在一对寡核苷酸阵列上对超过10万个单核苷酸多态性进行基因分型。
Nat Methods. 2004 Nov;1(2):109-11. doi: 10.1038/nmeth718.