• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ukbREST:在大型生物库中进行可重复研究的高效、精简的数据访问。

ukbREST: efficient and streamlined data access for reproducible research in large biobanks.

机构信息

Department of Medicine, Section of Genetic Medicine, The University of Chicago, Chicago, IL, USA.

Center for Translational Data Science, The University of Chicago, Chicago, IL, USA.

出版信息

Bioinformatics. 2019 Jun 1;35(11):1971-1973. doi: 10.1093/bioinformatics/bty925.

DOI:10.1093/bioinformatics/bty925
PMID:30395166
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6546122/
Abstract

SUMMARY

Large biobanks, such as UK Biobank with half a million participants, are changing the scale and availability of genotypic and phenotypic data for researchers to ask fundamental questions about the biology of health and disease. The breadth of the UK Biobank data is enabling discoveries at an unprecedented pace. However, this size and complexity pose new challenges to investigators who need to keep the accruing data up to date, comply with potential consent changes, and efficiently and reproducibly extract subsets of the data to answer specific scientific questions. Here we propose a tool called ukbREST designed for the UK Biobank study (easily extensible to other biobanks), which allows authorized users to efficiently retrieve phenotypic and genetic data. It exposes a REST API that makes data highly accessible inside a private and secure network, allowing the data specification in a human readable text format easily shareable with other researchers. These characteristics make ukbREST an important tool to make biobank's valuable data more readily accessible to the research community and facilitate reproducibility of the analysis, a key aspect of science.

AVAILABILITY AND IMPLEMENTATION

It is implemented in Python using the Flask-RESTful framework for the API, and it is under the MIT license. It works with PostgreSQL and a Docker image is available for easy deployment. The source code and documentation is available in Github: https://github.com/hakyimlab/ukbrest.

摘要

摘要

大型生物库,如拥有 50 万名参与者的英国生物库,正在改变基因型和表型数据的规模和可及性,使研究人员能够提出关于健康和疾病生物学的基本问题。英国生物库数据的广度正在以前所未有的速度带来发现。然而,这种规模和复杂性给研究人员带来了新的挑战,他们需要使不断积累的数据保持最新,遵守潜在的同意变更,并有效地和可重复地提取数据的子集来回答特定的科学问题。在这里,我们提出了一个名为 ukbREST 的工具,它是为英国生物库研究设计的(很容易扩展到其他生物库),允许授权用户高效地检索表型和遗传数据。它公开了一个 REST API,使数据在私有和安全的网络中高度可访问,允许以人类可读的文本格式指定数据,以便与其他研究人员轻松共享。这些特性使 ukbREST 成为一个重要的工具,可以使生物库的有价值的数据更容易被研究社区访问,并促进分析的可重复性,这是科学的一个关键方面。

可用性和实现

它是使用 Flask-RESTful 框架在 Python 中实现的,用于 API,并遵循 MIT 许可证。它与 PostgreSQL 一起使用,并且提供了一个 Docker 映像,便于部署。源代码和文档可在 Github 上获得:https://github.com/hakyimlab/ukbrest。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7273/6546122/8da9e3c545b6/bty925f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7273/6546122/8da9e3c545b6/bty925f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7273/6546122/8da9e3c545b6/bty925f1.jpg

相似文献

1
ukbREST: efficient and streamlined data access for reproducible research in large biobanks.ukbREST:在大型生物库中进行可重复研究的高效、精简的数据访问。
Bioinformatics. 2019 Jun 1;35(11):1971-1973. doi: 10.1093/bioinformatics/bty925.
2
XSI-a genotype compression tool for compressive genomics in large biobanks.XSI-a 基因型压缩工具,用于大型生物库中的压缩基因组学。
Bioinformatics. 2022 Aug 2;38(15):3778-3784. doi: 10.1093/bioinformatics/btac413.
3
NeuroPycon: An open-source python toolbox for fast multi-modal and reproducible brain connectivity pipelines.NeuroPycon:一个开源的 Python 工具包,用于快速进行多模态和可重复的脑连接管道。
Neuroimage. 2020 Oct 1;219:117020. doi: 10.1016/j.neuroimage.2020.117020. Epub 2020 Jun 6.
4
SIMBSIG: similarity search and clustering for biobank-scale data.SIMBSIG:用于生物库规模数据的相似性搜索和聚类。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac829.
5
Folic acid supplementation and malaria susceptibility and severity among people taking antifolate antimalarial drugs in endemic areas.在流行地区,服用抗叶酸抗疟药物的人群中,叶酸补充剂与疟疾易感性和严重程度的关系。
Cochrane Database Syst Rev. 2022 Feb 1;2(2022):CD014217. doi: 10.1002/14651858.CD014217.
6
Cellenium-a scalable and interactive visual analytics app for exploring multimodal single-cell data.Cellenium-一个用于探索多模态单细胞数据的可扩展和交互式的可视化分析应用程序。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad349.
7
SBMLDiagrams: a python package to process and visualize SBML layout and render.SBMLDiagrams:一个用于处理和可视化 SBML 布局和渲染的 Python 包。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac730.
8
The advantages of UK Biobank's open-access strategy for health research.英国生物样本库开放获取策略对健康研究的优势。
J Intern Med. 2019 Oct;286(4):389-397. doi: 10.1111/joim.12955. Epub 2019 Aug 2.
9
ppx: Programmatic Access to Proteomics Data Repositories.ppx:蛋白质组学数据存储库的编程访问。
J Proteome Res. 2021 Sep 3;20(9):4621-4624. doi: 10.1021/acs.jproteome.1c00454. Epub 2021 Aug 3.
10
Advancing Professionalization of Biobank Business Operations: A Worldwide Survey.推进生物样本库商业运营的专业化:一项全球调查。
Biopreserv Biobank. 2019;17(1):71-75. doi: 10.1089/bio.2018.0079. Epub 2018 Nov 9.

引用本文的文献

1
BrainXcan identifies brain features associated with behavioral and psychiatric traits using large-scale genetic and imaging data.BrainXcan利用大规模遗传和成像数据识别与行为和精神特质相关的脑特征。
Dev Cogn Neurosci. 2025 Mar 13;73:101542. doi: 10.1016/j.dcn.2025.101542.
2
LUKB: preparing local UK Biobank data for analysis.LUKB:准备英国生物银行本地数据以供分析。
Bioinform Adv. 2024 Nov 9;4(1):vbae176. doi: 10.1093/bioadv/vbae176. eCollection 2024.
3
Current state of data stewardship tools in life science.生命科学领域数据管理工具的现状

本文引用的文献

1
The UK Biobank resource with deep phenotyping and genomic data.英国生物银行资源库,具有深度表型和基因组数据。
Nature. 2018 Oct;562(7726):203-209. doi: 10.1038/s41586-018-0579-z. Epub 2018 Oct 10.
2
Million Veteran Program: A mega-biobank to study genetic influences on health and disease.百万退伍军人计划:一个大型生物银行,用于研究遗传对健康和疾病的影响。
J Clin Epidemiol. 2016 Feb;70:214-23. doi: 10.1016/j.jclinepi.2015.09.016. Epub 2015 Oct 9.
3
Genotyping Informatics and Quality Control for 100,000 Subjects in the Genetic Epidemiology Research on Adult Health and Aging (GERA) Cohort.
Front Big Data. 2024 Sep 16;7:1428568. doi: 10.3389/fdata.2024.1428568. eCollection 2024.
4
Revealing polygenic pleiotropy using genetic risk scores for asthma.利用哮喘遗传风险评分揭示多基因多效性。
HGG Adv. 2023 Aug 17;4(4):100233. doi: 10.1016/j.xhgg.2023.100233. eCollection 2023 Oct 12.
5
Polygenic transcriptome risk scores (PTRS) can improve portability of polygenic risk scores across ancestries.多基因转录组风险评分(PTRS)可以提高多基因风险评分在不同祖先群体间的可转移性。
Genome Biol. 2022 Jan 13;23(1):23. doi: 10.1186/s13059-021-02591-w.
6
Shared and distinct genetic risk factors for childhood-onset and adult-onset asthma: genome-wide and transcriptome-wide studies.儿童期和成人期哮喘的共享和独特遗传风险因素:全基因组和转录组研究。
Lancet Respir Med. 2019 Jun;7(6):509-522. doi: 10.1016/S2213-2600(19)30055-4. Epub 2019 Apr 27.
成人健康与衰老基因流行病学研究(GERA)队列中10万名受试者的基因分型信息学与质量控制
Genetics. 2015 Aug;200(4):1051-60. doi: 10.1534/genetics.115.178905. Epub 2015 Jun 19.
4
UK biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age.英国生物银行:一个用于识别多种中老年复杂疾病病因的开放获取资源。
PLoS Med. 2015 Mar 31;12(3):e1001779. doi: 10.1371/journal.pmed.1001779. eCollection 2015 Mar.
5
Bionimbus: a cloud for managing, analyzing and sharing large genomics datasets.Bionimbus:用于管理、分析和共享大型基因组数据集的云平台。
J Am Med Inform Assoc. 2014 Nov-Dec;21(6):969-75. doi: 10.1136/amiajnl-2013-002155. Epub 2014 Jan 24.