• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

我们在基因组的何处?基因组学研究中数据库使用的一个警示故事。

Where in the genome are we? A cautionary tale of database use in genomics research.

机构信息

Section on Statistical Genetics, Department of Biostatistics, University of Alabama at Birmingham Birmingham, AL, USA.

出版信息

Front Genet. 2013 Mar 21;4:38. doi: 10.3389/fgene.2013.00038. eCollection 2013.

DOI:10.3389/fgene.2013.00038
PMID:23519237
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3604632/
Abstract

With the advent of high throughput data genomic technologies the volume of available data is now staggering. In addition databases that provide resources to annotate, translate, and connect biological data have grown exponentially in content and use. The availability of such data emphasizes the importance of bioinformatics and computational biology in genomics research and has led to the development of thousands of tools to integrate and utilize these resources. When utilizing such resources, the principles of reproducible research are often overlooked. In this manuscript we provide selected case studies illustrating issues that may arise while working with genes and genetic polymorphisms. These case studies illustrate potential sources of error which can be introduced if the practices of reproducible research are not employed and non-concurrent databases are used. We also show examples of a lack of transparency when these databases are concerned when using popular bioinformatics tools. These examples highlight that resources are constantly evolving, and in order to provide reproducible results, research should be aware of and connected to the correct release of the data, particularly when implementing computational tools.

摘要

随着高通量数据基因组技术的出现,现在可用数据的数量令人震惊。此外,提供注释、翻译和连接生物数据资源的数据库在内容和使用方面呈指数级增长。这些数据的可用性强调了生物信息学和计算生物学在基因组学研究中的重要性,并导致了数千种工具的开发,以整合和利用这些资源。在利用这些资源时,通常会忽略可重复性研究的原则。在本文中,我们提供了一些选定的案例研究,说明了在使用基因和遗传多态性时可能出现的问题。这些案例研究说明了如果不采用可重复性研究的实践并使用非并发数据库,可能会引入潜在的错误源。我们还展示了在使用流行的生物信息学工具时,这些数据库存在缺乏透明度的例子。这些例子强调了资源在不断发展,如果要提供可重复的结果,研究应该意识到并连接到数据的正确版本,特别是在实施计算工具时。

相似文献

1
Where in the genome are we? A cautionary tale of database use in genomics research.我们在基因组的何处?基因组学研究中数据库使用的一个警示故事。
Front Genet. 2013 Mar 21;4:38. doi: 10.3389/fgene.2013.00038. eCollection 2013.
2
3
Enhancement of Plant Productivity in the Post-Genomics Era.后基因组时代植物生产力的提高
Curr Genomics. 2016 Aug;17(4):295-6. doi: 10.2174/138920291704160607182507.
4
Current bioinformatics tools in genomic biomedical research (Review).基因组生物医学研究中的当前生物信息学工具(综述)。
Int J Mol Med. 2006 Jun;17(6):967-73.
5
Managing core resources for genomics and proteomics.管理基因组学和蛋白质组学的核心资源。
Pharmacogenomics. 2003 May;4(3):343-50. doi: 10.1517/phgs.4.3.343.22689.
6
7
GNARE: automated system for high-throughput genome analysis with grid computational backend.GNARE:具有网格计算后端的高通量基因组分析自动化系统。
J Clin Monit Comput. 2005 Oct;19(4-5):361-9. doi: 10.1007/s10877-005-3463-y.
8
Rat Genome Database (RGD): mapping disease onto the genome.大鼠基因组数据库(RGD):将疾病映射到基因组上。
Nucleic Acids Res. 2002 Jan 1;30(1):125-8. doi: 10.1093/nar/30.1.125.
9
100 Years of evolving gene-disease complexities and scientific debutants.100 年基因-疾病复杂性的演变和科学新秀的崭露头角。
Brief Bioinform. 2020 May 21;21(3):885-905. doi: 10.1093/bib/bbz038.
10
Tools and strategies for physiological genomics: the Rat Genome Database.生理基因组学的工具与策略:大鼠基因组数据库
Physiol Genomics. 2005 Oct 17;23(2):246-56. doi: 10.1152/physiolgenomics.00040.2005. Epub 2005 Aug 16.

引用本文的文献

1
Genome, transcriptome and proteome: the rise of omics data and their integration in biomedical sciences.基因组学、转录组学和蛋白质组学:组学数据的兴起及其在生物医学科学中的整合。
Brief Bioinform. 2018 Mar 1;19(2):286-302. doi: 10.1093/bib/bbw114.
2
A meta-analysis of multiple matched copy number and transcriptomics data sets for inferring gene regulatory relationships.一项用于推断基因调控关系的多个匹配拷贝数和转录组学数据集的荟萃分析。
PLoS One. 2014 Aug 22;9(8):e105522. doi: 10.1371/journal.pone.0105522. eCollection 2014.

本文引用的文献

1
Ensembl 2012.Ensembl 2012.
Nucleic Acids Res. 2012 Jan;40(Database issue):D84-90. doi: 10.1093/nar/gkr991. Epub 2011 Nov 15.
2
What information should be required to support clinical "omics" publications?支持临床“组学”出版物需要哪些信息?
Clin Chem. 2011 May;57(5):688-90. doi: 10.1373/clinchem.2010.158618.
3
Case studies in reproducibility.可重复性研究案例
Brief Bioinform. 2011 May;12(3):288-300. doi: 10.1093/bib/bbq084. Epub 2011 Jan 28.
4
Entrez Gene: gene-centered information at NCBI.Entrez基因:美国国立医学图书馆国家生物技术信息中心的基因中心信息。
Nucleic Acids Res. 2011 Jan;39(Database issue):D52-7. doi: 10.1093/nar/gkq1237. Epub 2010 Nov 28.
5
Analysing biological pathways in genome-wide association studies.全基因组关联研究中的生物途径分析。
Nat Rev Genet. 2010 Dec;11(12):843-54. doi: 10.1038/nrg2884.
6
The UCSC Genome Browser database: update 2011.加州大学圣克鲁兹分校基因组浏览器数据库:2011年更新
Nucleic Acids Res. 2011 Jan;39(Database issue):D876-82. doi: 10.1093/nar/gkq963. Epub 2010 Oct 18.
7
genenames.org: the HGNC resources in 2011.基因名称组织:2011年的HGNC资源。
Nucleic Acids Res. 2011 Jan;39(Database issue):D514-9. doi: 10.1093/nar/gkq892. Epub 2010 Oct 6.
8
Galaxy: a comprehensive approach for supporting accessible, reproducible, and transparent computational research in the life sciences.Galaxy:一种支持生命科学领域可访问、可重现和透明计算研究的综合方法。
Genome Biol. 2010;11(8):R86. doi: 10.1186/gb-2010-11-8-r86. Epub 2010 Aug 25.
9
myExperiment: a repository and social network for the sharing of bioinformatics workflows.myExperiment:一个用于生物信息学工作流程共享的存储库和社交网络。
Nucleic Acids Res. 2010 Jul;38(Web Server issue):W677-82. doi: 10.1093/nar/gkq429. Epub 2010 May 25.
10
Computer science. Accessible reproducible research.计算机科学。可访问的可重复研究。
Science. 2010 Jan 22;327(5964):415-6. doi: 10.1126/science.1179653.