• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GESgnExt:基于基因表达综合数据库的基因表达特征提取和荟萃分析。

GESgnExt: Gene Expression Signature Extraction and Meta-Analysis on Gene Expression Omnibus.

出版信息

IEEE J Biomed Health Inform. 2020 Jan;24(1):311-318. doi: 10.1109/JBHI.2019.2896144. Epub 2019 Jan 30.

DOI:10.1109/JBHI.2019.2896144
PMID:30714937
Abstract

The gene expression omnibus (GEO) repository harbours an exponentially increasing number of gene expression studies. The expression data, as well as the related metadata, provides an abundant resource for knowledge discovery. Each study in GEO focuses on the gene expression perturbation of a specific subject (e.g., gene, drug, and disease). The identification of those subjects and the associations among them are beneficial for further in-depth studies. However, they cannot be directly inferred from the studies. A unified representation of those subjects (i.e., gene expression signatures) is desired. We developed GESgnExt for the automatic construction of gene expression signatures. The resultant 6542 signatures are built on 1934 series and 35 919 samples from GEO. To evaluate its significance, we calculated the similarities among those signatures and compared the discovered associations against the existing interaction databases. The signatures connect the genes, drugs, and diseases, covering most of the experimentally validated interactions. Besides, we have discovered 3307 novel signatures and their related associations, complementing the existing signature knowledge. The biomedical relevance of GESgnExt is demonstrated further in multiple case studies, providing mechanistic insights into its knowledge discovery process.

摘要

基因表达综合数据库(GEO)中存储了数量呈指数级增长的基因表达研究。这些表达数据以及相关的元数据为知识发现提供了丰富的资源。GEO 中的每一项研究都专注于特定主题(例如基因、药物和疾病)的基因表达扰动。这些主题的识别以及它们之间的关联对于进一步的深入研究是有益的。然而,这些关联并不能直接从研究中推断出来。人们希望有一种统一的方法来表示这些主题(即基因表达特征)。我们开发了 GESgnExt 来自动构建基因表达特征。由此产生的 6542 个特征基于来自 GEO 的 1934 个系列和 35919 个样本构建。为了评估其意义,我们计算了这些特征之间的相似性,并将发现的关联与现有的交互数据库进行了比较。这些特征连接了基因、药物和疾病,涵盖了大多数经过实验验证的相互作用。此外,我们还发现了 3307 个新的特征及其相关关联,补充了现有的特征知识。在多个案例研究中进一步证明了 GESgnExt 的生物医学相关性,为其知识发现过程提供了机制上的见解。

相似文献

1
GESgnExt: Gene Expression Signature Extraction and Meta-Analysis on Gene Expression Omnibus.GESgnExt:基于基因表达综合数据库的基因表达特征提取和荟萃分析。
IEEE J Biomed Health Inform. 2020 Jan;24(1):311-318. doi: 10.1109/JBHI.2019.2896144. Epub 2019 Jan 30.
2
The Gene Expression Omnibus Database.基因表达综合数据库
Methods Mol Biol. 2016;1418:93-110. doi: 10.1007/978-1-4939-3578-9_5.
3
CDS-DB, an omnibus for patient-derived gene expression signatures induced by cancer treatment.CDS-DB,一个综合数据库,包含癌症治疗诱导的患者来源基因表达特征。
Nucleic Acids Res. 2024 Jan 5;52(D1):D1163-D1179. doi: 10.1093/nar/gkad888.
4
Restructured GEO: restructuring Gene Expression Omnibus metadata for genome dynamics analysis.重构 GEO:用于基因组动态分析的基因表达综合(GEO)元数据重构。
Database (Oxford). 2019 Jan 1;2019:bay145. doi: 10.1093/database/bay145.
5
Getting the details right: gene signatures for cancer therapy.把握细节:癌症治疗的基因特征
Clin Chem. 2010 Sep;56(9):1378-80. doi: 10.1373/clinchem.2010.147686. Epub 2010 Jun 30.
6
Mining gene expression profiles: expression signatures as cancer phenotypes.挖掘基因表达谱:作为癌症表型的表达特征
Nat Rev Genet. 2007 Aug;8(8):601-9. doi: 10.1038/nrg2137. Epub 2007 Jul 3.
7
Strategies to explore functional genomics data sets in NCBI's GEO database.探索美国国立医学图书馆基因表达综合数据库(NCBI's GEO database)中功能基因组学数据集的策略。
Methods Mol Biol. 2012;802:41-53. doi: 10.1007/978-1-61779-400-1_3.
8
Gemma: a resource for the reuse, sharing and meta-analysis of expression profiling data.Gemma:一个用于再利用、共享和表达谱数据分析元分析的资源。
Bioinformatics. 2012 Sep 1;28(17):2272-3. doi: 10.1093/bioinformatics/bts430. Epub 2012 Jul 10.
9
Discovery of perturbation gene targets via free text metadata mining in Gene Expression Omnibus.通过在基因表达综合数据库中进行自由文本元数据挖掘发现干扰基因靶标。
Comput Biol Chem. 2019 Jun;80:152-158. doi: 10.1016/j.compbiolchem.2019.03.014. Epub 2019 Mar 24.
10
Extraction and analysis of signatures from the Gene Expression Omnibus by the crowd.大众对基因表达综合数据库中的特征进行提取和分析。
Nat Commun. 2016 Sep 26;7:12846. doi: 10.1038/ncomms12846.

引用本文的文献

1
Screening and identification of novel protein markers of early-stage lung cancer and construction and application of screening models.早期肺癌新型蛋白质标志物的筛选与鉴定及筛选模型的构建与应用
Front Oncol. 2025 May 27;15:1567673. doi: 10.3389/fonc.2025.1567673. eCollection 2025.
2
Investigation of the function of the novel tumor marker in lung adenocarcinoma based on data mining and analysis.基于数据挖掘与分析对新型肿瘤标志物在肺腺癌中的功能进行研究。
J Thorac Dis. 2023 Apr 28;15(4):1749-1769. doi: 10.21037/jtd-23-314. Epub 2023 Apr 10.
3
A novel epithelial-mesenchymal transition (EMT)-related gene signature of predictive value for the survival outcomes in lung adenocarcinoma.
一种对肺腺癌生存结局具有预测价值的新型上皮-间质转化(EMT)相关基因特征。
Front Oncol. 2022 Sep 15;12:974614. doi: 10.3389/fonc.2022.974614. eCollection 2022.
4
SigCom LINCS: data and metadata search engine for a million gene expression signatures.SigCom LINCS:用于百万个基因表达特征的数据集和元数据搜索引擎。
Nucleic Acids Res. 2022 Jul 5;50(W1):W697-W709. doi: 10.1093/nar/gkac328.