• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

释放流行病学中的基因型——一种管理高通量信息的新方法。

Unleashing genotypes in epidemiology - A novel method for managing high throughput information.

机构信息

Karolinska Institutet, Stockholm, Sweden.

出版信息

J Biomed Inform. 2009 Dec;42(6):1029-34. doi: 10.1016/j.jbi.2009.07.005. Epub 2009 Jul 17.

DOI:10.1016/j.jbi.2009.07.005
PMID:19616640
Abstract

The large amounts of data generated when high-throughput genotyping methods are used in large-scale epidemiological studies (>10,000 participants) present an enormous challenge to researchers in terms of structured data management. In order to face these challenges, a system has been designed and implemented where genotype data can be efficiently stored. Focus has been on enabling researchers to collaborate by sharing genotype data with each other in a secure and controlled way. Genotype data is available where individuals can be selected using phenotype information and access to specific SNPs can be controlled using user-defined filters. Further value has been added to the basic genotypic information by including extensive metadata. Performance testing of the system was carried out using both artificial and real-world genotype data and shows that the implementation handles large datasets with a linear increase in extraction time and that the retrieval performance is more than sufficient for near-future genotyping research.

摘要

当高通量基因分型方法在大规模流行病学研究(>10000 名参与者)中使用时,所产生的大量数据给研究人员在结构化数据管理方面带来了巨大的挑战。为了应对这些挑战,已经设计并实现了一个系统,以便有效地存储基因型数据。该系统的重点是通过以安全和受控的方式彼此共享基因型数据,使研究人员能够进行协作。个体可以使用表型信息进行选择,并且可以使用用户定义的过滤器控制特定 SNP 的访问,从而提供基因型数据。通过包含广泛的元数据,为基本的基因分型信息添加了更多价值。使用人工和真实世界的基因型数据对系统进行了性能测试,结果表明,该实现可以处理具有线性增加提取时间的大型数据集,并且检索性能对于未来的基因分型研究来说已经足够了。

相似文献

1
Unleashing genotypes in epidemiology - A novel method for managing high throughput information.释放流行病学中的基因型——一种管理高通量信息的新方法。
J Biomed Inform. 2009 Dec;42(6):1029-34. doi: 10.1016/j.jbi.2009.07.005. Epub 2009 Jul 17.
2
Alkahest NuclearBLAST : a user-friendly BLAST management and analysis system.阿尔卡hest核BLAST:一个用户友好的BLAST管理与分析系统。
BMC Bioinformatics. 2005 Jun 15;6:147. doi: 10.1186/1471-2105-6-147.
3
A Grid-based solution for management and analysis of microarrays in distributed experiments.一种用于分布式实验中微阵列管理与分析的基于网格的解决方案。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S7. doi: 10.1186/1471-2105-8-S1-S7.
4
Classification of information fusion methods in systems biology.系统生物学中信息融合方法的分类
In Silico Biol. 2009;9(3):65-76.
5
Mass data exploration in oncology: an information synthesis approach.
J Biomed Inform. 2009 Aug;42(4):612-23. doi: 10.1016/j.jbi.2009.02.007. Epub 2009 Mar 1.
6
GeneTools--application for functional annotation and statistical hypothesis testing.基因工具——用于功能注释和统计假设检验的应用程序。
BMC Bioinformatics. 2006 Oct 24;7:470. doi: 10.1186/1471-2105-7-470.
7
An agent- and ontology-based system for integrating public gene, protein, and disease databases.一种基于代理和本体的用于整合公共基因、蛋白质和疾病数据库的系统。
J Biomed Inform. 2007 Feb;40(1):17-29. doi: 10.1016/j.jbi.2006.02.014. Epub 2006 Mar 20.
8
Dynamic variable selection in SNP genotype autocalling from APEX microarray data.基于APEX微阵列数据的SNP基因型自动分型中的动态变量选择
BMC Bioinformatics. 2006 Nov 30;7:521. doi: 10.1186/1471-2105-7-521.
9
High-throughput identification, database storage and analysis of SNPs in EST sequences.EST序列中SNP的高通量鉴定、数据库存储及分析
Genome Inform. 2001;12:194-203.
10
YAdumper: extracting and translating large information volumes from relational databases to structured flat files.YAdumper:从关系数据库中提取大量信息并将其翻译成结构化平面文件。
Bioinformatics. 2004 Oct 12;20(15):2455-7. doi: 10.1093/bioinformatics/bth243. Epub 2004 Apr 29.

引用本文的文献

1
Damming the genomic data flood using a comprehensive analysis and storage data structure.利用综合分析和存储数据结构来遏制基因组数据洪流。
Database (Oxford). 2010 Dec 15;2010:baq029. doi: 10.1093/database/baq029. Print 2010.