• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SGI:组学数据集中的自动临床亚组识别

SGI: automatic clinical subgroup identification in omics datasets.

作者信息

Buyukozkan Mustafa, Suhre Karsten, Krumsiek Jan

机构信息

Department of Physiology and Biophysics, Institute for Computational Biomedicine, New York, NY 10021, USA.

Englander Institute for Precision Medicine, Weill Cornell Medicine, New York, NY 10021, USA.

出版信息

Bioinformatics. 2022 Jan 3;38(2):573-576. doi: 10.1093/bioinformatics/btab656.

DOI:10.1093/bioinformatics/btab656
PMID:34529048
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8723155/
Abstract

SUMMARY

The 'Subgroup Identification' (SGI) toolbox provides an algorithm to automatically detect clinical subgroups of samples in large-scale omics datasets. It is based on hierarchical clustering trees in combination with a specifically designed association testing and visualization framework that can process an arbitrary number of clinical parameters and outcomes in a systematic fashion. A multi-block extension allows for the simultaneous use of multiple omics datasets on the same samples. In this article, we first describe the functionality of the toolbox and then demonstrate its capabilities through application examples on a type 2 diabetes metabolomics study as well as two copy number variation datasets from The Cancer Genome Atlas.

AVAILABILITY AND IMPLEMENTATION

SGI is an open-source package implemented in R. Package source codes and hands-on tutorials are available at https://github.com/krumsieklab/sgi. The QMdiab metabolomics data is included in the package and can be downloaded from https://doi.org/10.6084/m9.figshare.5904022.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

“亚组识别”(SGI)工具箱提供了一种算法,用于自动检测大规模组学数据集中样本的临床亚组。它基于层次聚类树,并结合了专门设计的关联测试和可视化框架,该框架能够以系统的方式处理任意数量的临床参数和结果。多模块扩展允许在相同样本上同时使用多个组学数据集。在本文中,我们首先描述该工具箱的功能,然后通过在2型糖尿病代谢组学研究以及来自癌症基因组图谱的两个拷贝数变异数据集上的应用示例来展示其能力。

可用性与实现

SGI是一个用R语言实现的开源软件包。软件包源代码和实践教程可在https://github.com/krumsieklab/sgi获取。QMdiab代谢组学数据包含在该软件包中,可从https://doi.org/10.6084/m9.figshare.5904022下载。

补充信息

补充数据可在《生物信息学》在线获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fdcf/8723155/c3c3c39f35df/btab656f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fdcf/8723155/c3c3c39f35df/btab656f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fdcf/8723155/c3c3c39f35df/btab656f1.jpg

相似文献

1
SGI: automatic clinical subgroup identification in omics datasets.SGI:组学数据集中的自动临床亚组识别
Bioinformatics. 2022 Jan 3;38(2):573-576. doi: 10.1093/bioinformatics/btab656.
2
The nPYc-Toolbox, a Python module for the pre-processing, quality-control and analysis of metabolic profiling datasets.nPYc-Toolbox,一个用于代谢组学数据集预处理、质量控制和分析的 Python 模块。
Bioinformatics. 2019 Dec 15;35(24):5359-5360. doi: 10.1093/bioinformatics/btz566.
3
scGate: marker-based purification of cell types from heterogeneous single-cell RNA-seq datasets.scGate:基于标记的异质单细胞 RNA-seq 数据集细胞类型的纯化。
Bioinformatics. 2022 Apr 28;38(9):2642-2644. doi: 10.1093/bioinformatics/btac141.
4
ATHENA: analysis of tumor heterogeneity from spatial omics measurements.ATHENA:基于空间组学测量的肿瘤异质性分析。
Bioinformatics. 2022 May 26;38(11):3151-3153. doi: 10.1093/bioinformatics/btac303.
5
HCMMCNVs: hierarchical clustering mixture model of copy number variants detection using whole exome sequencing technology.HCMMCNVs:基于全外显子测序技术的拷贝数变异检测的层次聚类混合模型。
Bioinformatics. 2021 Sep 29;37(18):3026-3028. doi: 10.1093/bioinformatics/btab183.
6
Identifying interactions in omics data for clinical biomarker discovery using symbolic regression.利用符号回归识别组学数据中的相互作用,以发现临床生物标志物。
Bioinformatics. 2022 Aug 2;38(15):3749-3758. doi: 10.1093/bioinformatics/btac405.
7
Canvas: versatile and scalable detection of copy number variants.Canvas:灵活且可扩展的拷贝数变异检测。
Bioinformatics. 2016 Aug 1;32(15):2375-7. doi: 10.1093/bioinformatics/btw163. Epub 2016 Mar 24.
8
maplet: an extensible R toolbox for modular and reproducible metabolomics pipelines.maplet:用于模块化和可重复的代谢组学管道的可扩展的 R 工具包。
Bioinformatics. 2022 Jan 27;38(4):1168-1170. doi: 10.1093/bioinformatics/btab741.
9
MoDentify: phenotype-driven module identification in metabolomics networks at different resolutions.MoDentify:在不同分辨率下代谢组学网络中表型驱动的模块识别。
Bioinformatics. 2019 Feb 1;35(3):532-534. doi: 10.1093/bioinformatics/bty650.
10
DBDIpy: a Python library for processing of untargeted datasets from real-time plasma ionization mass spectrometry.DBDIpy:一个用于处理实时等离子体质谱仪非靶向数据集的 Python 库。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad088.

引用本文的文献

1
Individual bioenergetic capacity as a potential source of resilience to Alzheimer's disease.个体生物能量能力作为对阿尔茨海默病恢复力的潜在来源。
Nat Commun. 2025 Feb 24;16(1):1910. doi: 10.1038/s41467-025-57032-0.