• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

人类转录生物标志物数据精选汇编。

Curated compendium of human transcriptional biomarker data.

机构信息

Department of Biology, Brigham Young University, Provo, Utah 84602, USA.

Northeast Ohio Medical University, Rootstown, Ohio 44272, USA.

出版信息

Sci Data. 2018 Apr 17;5:180066. doi: 10.1038/sdata.2018.66.

DOI:10.1038/sdata.2018.66
PMID:29664470
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5903354/
Abstract

One important use of genome-wide transcriptional profiles is to identify relationships between transcription levels and patient outcomes. These translational insights can guide the development of biomarkers for clinical application. Data from thousands of translational-biomarker studies have been deposited in public repositories, enabling reuse. However, data-reuse efforts require considerable time and expertise because transcriptional data are generated using heterogeneous profiling technologies, preprocessed using diverse normalization procedures, and annotated in non-standard ways. To address this problem, we curated 45 publicly available, translational-biomarker datasets from a variety of human diseases. To increase the data's utility, we reprocessed the raw expression data using a uniform computational pipeline, addressed quality-control problems, mapped the clinical annotations to a controlled vocabulary, and prepared consistently structured, analysis-ready data files. These data, along with scripts we used to prepare the data, are available in a public repository. We believe these data will be particularly useful to researchers seeking to perform benchmarking studies-for example, to compare and optimize machine-learning algorithms' ability to predict biomedical outcomes.

摘要

全基因组转录谱的一个重要用途是识别转录水平与患者预后之间的关系。这些转化见解可以指导临床应用的生物标志物的开发。来自数千项转化生物标志物研究的数据已被存入公共存储库中,可供重复使用。然而,数据再利用工作需要大量的时间和专业知识,因为转录数据是使用异构的分析技术生成的,使用不同的标准化程序进行预处理,并以非标准的方式进行注释。为了解决这个问题,我们从各种人类疾病中整理了 45 个公开的转化生物标志物数据集。为了增加数据的实用性,我们使用统一的计算流程重新处理了原始表达数据,解决了质量控制问题,将临床注释映射到受控词汇表,并准备了结构一致、可用于分析的数据文件。这些数据以及我们用于准备数据的脚本可在公共存储库中获得。我们相信这些数据对于寻求进行基准测试研究的研究人员特别有用,例如,比较和优化机器学习算法预测生物医学结果的能力。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/664cc45a26b3/sdata201866-f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/78c01079f9a6/sdata201866-f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/f732f6f5b661/sdata201866-f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/664cc45a26b3/sdata201866-f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/78c01079f9a6/sdata201866-f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/f732f6f5b661/sdata201866-f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/41fd/5903354/664cc45a26b3/sdata201866-f3.jpg

相似文献

1
Curated compendium of human transcriptional biomarker data.人类转录生物标志物数据精选汇编。
Sci Data. 2018 Apr 17;5:180066. doi: 10.1038/sdata.2018.66.
2
A curated compendium of monocyte transcriptome datasets of relevance to human monocyte immunobiology research.与人类单核细胞免疫生物学研究相关的单核细胞转录组数据集的精选汇编。
F1000Res. 2016 Apr 25;5:291. doi: 10.12688/f1000research.8182.2. eCollection 2016.
3
A compendium of monocyte transcriptome datasets to foster biomedical knowledge discovery.单核细胞转录组数据集简编,以促进生物医学知识发现。
F1000Res. 2016 Mar 7;5:291. doi: 10.12688/f1000research.8182.1. eCollection 2016.
4
Functional genomics and proteomics in the clinical neurosciences: data mining and bioinformatics.临床神经科学中的功能基因组学和蛋白质组学:数据挖掘与生物信息学
Prog Brain Res. 2006;158:83-108. doi: 10.1016/S0079-6123(06)58004-5.
5
inSilicoDb: an R/Bioconductor package for accessing human Affymetrix expert-curated datasets from GEO.inSilicoDb:一个用于从 GEO 访问人类 Affymetrix 专家 curated 数据集的 R/Bioconductor 包。
Bioinformatics. 2011 Nov 15;27(22):3204-5. doi: 10.1093/bioinformatics/btr529. Epub 2011 Sep 21.
6
BioDataome: a collection of uniformly preprocessed and automatically annotated datasets for data-driven biology.生物数据库:用于数据驱动生物学的统一预处理和自动注释数据集集合。
Database (Oxford). 2018 Jan 1;2018. doi: 10.1093/database/bay011.
7
A beginner's guide into curated analyses of open access datasets for biomarker discovery in neurodegeneration.生物标志物发现的开放获取数据集策展分析入门指南。
Sci Data. 2023 Jul 6;10(1):432. doi: 10.1038/s41597-023-02338-1.
8
A comprehensive approach to gene expression profiling in immune cells.免疫细胞中基因表达谱的综合分析方法。
Methods Enzymol. 2020;636:1-47. doi: 10.1016/bs.mie.2019.07.005. Epub 2019 Aug 7.
9
JingleBells: A Repository of Immune-Related Single-Cell RNA-Sequencing Datasets.《铃儿响叮当》:一个免疫相关单细胞RNA测序数据集的储存库。
J Immunol. 2017 May 1;198(9):3375-3379. doi: 10.4049/jimmunol.1700272.
10
Warehousing re-annotated cancer genes for biomarker meta-analysis.癌症基因仓库重新注释用于生物标志物荟萃分析。
Comput Methods Programs Biomed. 2013 Jul;111(1):166-80. doi: 10.1016/j.cmpb.2013.03.010. Epub 2013 Apr 29.

引用本文的文献

1
TidyGEO: preparing analysis-ready datasets from Gene Expression Omnibus.TidyGEO:从基因表达综合数据库准备分析就绪数据集。
J Integr Bioinform. 2023 Dec 5;21(1). doi: 10.1515/jib-2023-0021. eCollection 2024 Mar 1.
2
The ability to classify patients based on gene-expression data varies by algorithm and performance metric.基于基因表达数据对患者进行分类的能力因算法和性能指标而异。
PLoS Comput Biol. 2022 Mar 11;18(3):e1009926. doi: 10.1371/journal.pcbi.1009926. eCollection 2022 Mar.

本文引用的文献

1
Peripheral Blood Cell Gene Expression Diagnostic for Identifying Symptomatic Transthyretin Amyloidosis Patients: Male and Female Specific Signatures.用于识别有症状的转甲状腺素蛋白淀粉样变性患者的外周血细胞基因表达诊断:男性和女性特异性特征
Theranostics. 2016 Jul 18;6(11):1792-809. doi: 10.7150/thno.14584. eCollection 2016.
2
shinyGEO: a web-based application for analyzing gene expression omnibus datasets.shinyGEO:一个用于分析基因表达综合数据集的网络应用程序。
Bioinformatics. 2016 Dec 1;32(23):3679-3681. doi: 10.1093/bioinformatics/btw519. Epub 2016 Aug 8.
3
The Doppelgänger Effect: Hidden Duplicates in Databases of Transcriptome Profiles.
分身效应:转录组图谱数据库中的隐藏副本
J Natl Cancer Inst. 2016 Jul 5;108(11). doi: 10.1093/jnci/djw146. Print 2016 Nov.
4
The Landscape of Prognostic Outlier Genes in High-Risk Prostate Cancer.高危前列腺癌预后异常基因的研究现状。
Clin Cancer Res. 2016 Apr 1;22(7):1777-86. doi: 10.1158/1078-0432.CCR-15-1250. Epub 2015 Dec 2.
5
Gene-expression patterns in peripheral blood classify familial breast cancer susceptibility.外周血中的基因表达模式可对家族性乳腺癌易感性进行分类。
BMC Med Genomics. 2015 Nov 4;8:72. doi: 10.1186/s12920-015-0145-6.
6
Sphingosine-1-phosphate lyase is an endogenous suppressor of pulmonary fibrosis: role of S1P signalling and autophagy.鞘氨醇-1-磷酸酶是肺纤维化的内源性抑制剂:S1P 信号和自噬的作用。
Thorax. 2015 Dec;70(12):1138-48. doi: 10.1136/thoraxjnl-2014-206684. Epub 2015 Aug 18.
7
Gene Expression Profiling of Desmoid Tumors by cDNA Microarrays and Correlation with Progression-Free Survival.应用 cDNA 微阵列对硬纤维瘤进行基因表达谱分析及其与无进展生存期的相关性。
Clin Cancer Res. 2015 Sep 15;21(18):4194-200. doi: 10.1158/1078-0432.CCR-14-2910. Epub 2015 Apr 15.
8
MicroRNA polymorphisms and risk of colorectal cancer.微小RNA多态性与结直肠癌风险
Cancer Epidemiol Biomarkers Prev. 2015 Jan;24(1):65-72. doi: 10.1158/1055-9965.EPI-14-0219. Epub 2014 Oct 23.
9
The prognostic ease and difficulty of invasive breast carcinoma.浸润性乳腺癌的预后难易程度。
Cell Rep. 2014 Oct 9;9(1):129-142. doi: 10.1016/j.celrep.2014.08.073. Epub 2014 Oct 2.
10
Molecular classifiers for acute kidney transplant rejection in peripheral blood by whole genome gene expression profiling.通过全基因组基因表达谱分析在外周血中用于急性肾移植排斥反应的分子分类器。
Am J Transplant. 2014 May;14(5):1164-72. doi: 10.1111/ajt.12671. Epub 2014 Apr 11.