• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SNPLims:一种用于全基因组关联研究的数据管理系统。

SNPLims: a data management system for genome wide association studies.

作者信息

Orro Alessandro, Guffanti Guia, Salvi Erika, Macciardi Fabio, Milanesi Luciano

机构信息

Consorzio Interuniversitario Lombardo per l'Elaborazione Automatica, Via Sanzio Raffaello 4, 20090 Segrate (MI), Italy.

出版信息

BMC Bioinformatics. 2008 Mar 26;9 Suppl 2(Suppl 2):S13. doi: 10.1186/1471-2105-9-S2-S13.

DOI:10.1186/1471-2105-9-S2-S13
PMID:18387201
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2323662/
Abstract

BACKGROUND

Recent progresses in genotyping technologies allow the generation high-density genetic maps using hundreds of thousands of genetic markers for each DNA sample. The availability of this large amount of genotypic data facilitates the whole genome search for genetic basis of diseases. We need a suitable information management system to efficiently manage the data flow produced by whole genome genotyping and to make it available for further analyses.

RESULTS

We have developed an information system mainly devoted to the storage and management of SNP genotype data produced by the Illumina platform from the raw outputs of genotyping into a relational database. The relational database can be accessed in order to import any existing data and export user-defined formats compatible with many different genetic analysis programs. After calculating family-based or case-control association study data, the results can be imported in SNPLims. One of the main features is to allow the user to rapidly identify and annotate statistically relevant polymorphisms from the large volume of data analyzed. Results can be easily visualized either graphically or creating ASCII comma separated format output files, which can be used as input to further analyses.

CONCLUSIONS

The proposed infrastructure allows to manage a relatively large amount of genotypes for each sample and an arbitrary number of samples and phenotypes. Moreover, it enables the users to control the quality of the data and to perform the most common screening analyses and identify genes that become "candidate" for the disease under consideration.

摘要

背景

基因分型技术的最新进展使得能够为每个DNA样本使用数十万遗传标记生成高密度遗传图谱。如此大量的基因型数据的可得性促进了对疾病遗传基础的全基因组搜索。我们需要一个合适的信息管理系统来有效管理全基因组基因分型产生的数据流,并使其可用于进一步分析。

结果

我们开发了一个信息系统,主要致力于将Illumina平台产生的SNP基因型数据从基因分型的原始输出存储和管理到关系数据库中。可以访问该关系数据库以导入任何现有数据并导出与许多不同遗传分析程序兼容的用户定义格式。在计算基于家系或病例对照的关联研究数据后,结果可以导入到SNPLims中。其主要特点之一是允许用户从大量分析数据中快速识别和注释具有统计学意义的多态性。结果可以很容易地以图形方式可视化或创建ASCII逗号分隔格式的输出文件,这些文件可以用作进一步分析的输入。

结论

所提出的基础设施允许管理每个样本相对大量的基因型以及任意数量的样本和表型。此外,它使用户能够控制数据质量,并进行最常见的筛选分析,识别出成为所研究疾病“候选”的基因。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/a4a1a186c072/1471-2105-9-S2-S13-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/2cac6c6c3a25/1471-2105-9-S2-S13-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/eb9f5a2216f4/1471-2105-9-S2-S13-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/e04d72ef8e63/1471-2105-9-S2-S13-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/bcc286de34ba/1471-2105-9-S2-S13-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/68c1510e0c57/1471-2105-9-S2-S13-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/9030ca48f4c3/1471-2105-9-S2-S13-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/a4a1a186c072/1471-2105-9-S2-S13-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/2cac6c6c3a25/1471-2105-9-S2-S13-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/eb9f5a2216f4/1471-2105-9-S2-S13-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/e04d72ef8e63/1471-2105-9-S2-S13-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/bcc286de34ba/1471-2105-9-S2-S13-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/68c1510e0c57/1471-2105-9-S2-S13-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/9030ca48f4c3/1471-2105-9-S2-S13-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fab6/2323662/a4a1a186c072/1471-2105-9-S2-S13-7.jpg

相似文献

1
SNPLims: a data management system for genome wide association studies.SNPLims:一种用于全基因组关联研究的数据管理系统。
BMC Bioinformatics. 2008 Mar 26;9 Suppl 2(Suppl 2):S13. doi: 10.1186/1471-2105-9-S2-S13.
2
SNPP: automating large-scale SNP genotype data management.SNPP:大规模单核苷酸多态性(SNP)基因型数据管理自动化
Bioinformatics. 2005 Jan 15;21(2):266-8. doi: 10.1093/bioinformatics/bth486. Epub 2004 Sep 17.
3
SNP Function Portal: a web database for exploring the function implication of SNP alleles.单核苷酸多态性(SNP)功能门户:一个用于探索SNP等位基因功能含义的网络数据库。
Bioinformatics. 2006 Jul 15;22(14):e523-9. doi: 10.1093/bioinformatics/btl241.
4
lga972: a cross-platform application for optimizing LD studies using a genetic algorithm.LGA972:一款使用遗传算法优化连锁不平衡(LD)研究的跨平台应用程序。
Bioinformatics. 2004 Nov 22;20(17):3244-5. doi: 10.1093/bioinformatics/bth348. Epub 2004 Jun 4.
5
Using Chado to store genome annotation data.使用Chado存储基因组注释数据。
Curr Protoc Bioinformatics. 2006 Jan;Chapter 9:Unit 9.6. doi: 10.1002/0471250953.bi0906s12.
6
ALOHOMORA: a tool for linkage analysis using 10K SNP array data.阿洛霍莫拉:一种使用10K单核苷酸多态性(SNP)阵列数据进行连锁分析的工具。
Bioinformatics. 2005 May 1;21(9):2123-5. doi: 10.1093/bioinformatics/bti264. Epub 2005 Jan 12.
7
IntegratedMap: a Web interface for integrating genetic map data.整合图谱:用于整合遗传图谱数据的网络界面。
Bioinformatics. 2005 May 1;21(9):2126-7. doi: 10.1093/bioinformatics/bti271. Epub 2005 Jan 18.
8
Mega2: data-handling for facilitating genetic linkage and association analyses.Mega2:用于促进基因连锁和关联分析的数据处理
Bioinformatics. 2005 May 15;21(10):2556-7. doi: 10.1093/bioinformatics/bti364. Epub 2005 Mar 3.
9
Visualization of genomic aberrations using Affymetrix SNP arrays.使用Affymetrix SNP阵列对基因组畸变进行可视化分析。
Bioinformatics. 2007 Feb 15;23(4):496-7. doi: 10.1093/bioinformatics/btl608. Epub 2006 Nov 30.
10
iMap: a database-driven utility to integrate and access the genetic and physical maps of maize.iMap:一个由数据库驱动的工具,用于整合和访问玉米的遗传图谱与物理图谱。
Bioinformatics. 2003 Nov 1;19(16):2105-11. doi: 10.1093/bioinformatics/btg289.

引用本文的文献

1
Data management system for diabetes clinical trials: a pre-post evaluation study.糖尿病临床试验数据管理系统:一项前后评估研究。
BMC Med Inform Decis Mak. 2023 Jan 20;23(1):14. doi: 10.1186/s12911-023-02110-w.
2
A PostgreSQL Tripal solution for large-scale genotypic and phenotypic data.一个用于大规模基因型和表型数据的 PostgreSQL Tripal 解决方案。
Database (Oxford). 2021 Aug 14;2021. doi: 10.1093/database/baab051.
3
TheSNPpit-A High Performance Database System for Managing Large Scale SNP Data.SNPpit - 一个用于管理大规模SNP数据的高性能数据库系统。

本文引用的文献

1
Principal components analysis corrects for stratification in genome-wide association studies.主成分分析可校正全基因组关联研究中的分层现象。
Nat Genet. 2006 Aug;38(8):904-9. doi: 10.1038/ng1847. Epub 2006 Jul 23.
2
T.I.M.S: TaqMan Information Management System, tools to organize data flow in a genotyping laboratory.T.I.M.S:TaqMan信息管理系统,用于在基因分型实验室中组织数据流的工具。
BMC Bioinformatics. 2005 Oct 12;6:246. doi: 10.1186/1471-2105-6-246.
3
'PACLIMS': a component LIM system for high-throughput functional genomic analysis.
PLoS One. 2016 Oct 25;11(10):e0164043. doi: 10.1371/journal.pone.0164043. eCollection 2016.
4
A tool for mapping Single Nucleotide Polymorphisms using Graphics Processing Units.利用图形处理单元进行单核苷酸多态性作图的工具。
BMC Bioinformatics. 2014;15 Suppl 1(Suppl 1):S10. doi: 10.1186/1471-2105-15-S1-S10. Epub 2014 Jan 10.
5
snp-search: simple processing, manipulation and searching of SNPs from high-throughput sequencing.SNP搜索:对来自高通量测序的单核苷酸多态性进行简单处理、操作和搜索。
BMC Bioinformatics. 2013 Nov 19;14:326. doi: 10.1186/1471-2105-14-326.
6
SNPflow: a lightweight application for the processing, storing and automatic quality checking of genotyping assays.SNPflow:一个用于处理、存储和自动检测基因分型检测的轻量级应用程序。
PLoS One. 2013;8(3):e59508. doi: 10.1371/journal.pone.0059508. Epub 2013 Mar 19.
7
MolabIS--an integrated information system for storing and managing molecular genetics data.MolabIS——一个用于存储和管理分子遗传学数据的集成信息系统。
BMC Bioinformatics. 2011 Oct 31;12:425. doi: 10.1186/1471-2105-12-425.
8
SNPpy--database management for SNP data from genome wide association studies.SNPpy——全基因组关联研究中 SNP 数据的数据库管理。
PLoS One. 2011;6(10):e24982. doi: 10.1371/journal.pone.0024982. Epub 2011 Oct 19.
9
GWAS analyzer: integrating genotype, phenotype and public annotation data for genome-wide association study analysis.GWAS 分析器:用于全基因组关联研究分析的基因型、表型和公共注释数据的整合。
Bioinformatics. 2010 Feb 15;26(4):560-4. doi: 10.1093/bioinformatics/btp714. Epub 2010 Jan 6.
10
Genome-wide association studies: quality control and population-based measures.全基因组关联研究:质量控制和基于人群的措施。
Genet Epidemiol. 2009;33 Suppl 1(Suppl 1):S45-50. doi: 10.1002/gepi.20472.
“PACLIMS”:一种用于高通量功能基因组分析的组件式实验室信息管理系统
BMC Bioinformatics. 2005 Apr 12;6:94. doi: 10.1186/1471-2105-6-94.
4
SNPHunter: a bioinformatic software for single nucleotide polymorphism data acquisition and management.SNPHunter:一款用于单核苷酸多态性数据采集与管理的生物信息学软件。
BMC Bioinformatics. 2005 Mar 18;6:60. doi: 10.1186/1471-2105-6-60.
5
SNPP: automating large-scale SNP genotype data management.SNPP:大规模单核苷酸多态性(SNP)基因型数据管理自动化
Bioinformatics. 2005 Jan 15;21(2):266-8. doi: 10.1093/bioinformatics/bth486. Epub 2004 Sep 17.
6
Haploview: analysis and visualization of LD and haplotype maps.Haploview:连锁不平衡(LD)和单倍型图谱的分析与可视化
Bioinformatics. 2005 Jan 15;21(2):263-5. doi: 10.1093/bioinformatics/bth457. Epub 2004 Aug 5.
7
PedSplit: pedigree management for stratified analysis.PedSplit:用于分层分析的家系管理
Bioinformatics. 2004 Sep 22;20(14):2315-6. doi: 10.1093/bioinformatics/bth224. Epub 2004 Apr 1.
8
A comparison of bayesian methods for haplotype reconstruction from population genotype data.基于群体基因型数据的单倍型重建贝叶斯方法比较。
Am J Hum Genet. 2003 Nov;73(5):1162-9. doi: 10.1086/379378. Epub 2003 Oct 20.
9
An integrated system for high throughput TaqMan based SNP genotyping.一种基于TaqMan的高通量单核苷酸多态性基因分型集成系统。
Bioinformatics. 2001 Jul;17(7):654-5. doi: 10.1093/bioinformatics/17.7.654.
10
Toward high-throughput genotyping: dynamic and automatic software for manipulating large-scale genotype data using fluorescently labeled dinucleotide markers.迈向高通量基因分型:使用荧光标记二核苷酸标记物处理大规模基因型数据的动态自动化软件。
Genome Res. 2001 Jul;11(7):1304-14. doi: 10.1101/gr.159701.