• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

multiclassPairs:一个用于训练多类基于对的分类器的 R 包。

multiclassPairs: an R package to train multiclass pair-based classifier.

机构信息

Department of Clinical Sciences, Division of Oncology, Lund University, 22381 Lund, Sweden.

出版信息

Bioinformatics. 2021 Sep 29;37(18):3043-3044. doi: 10.1093/bioinformatics/btab088.

DOI:10.1093/bioinformatics/btab088
PMID:33543757
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8479681/
Abstract

MOTIVATION

k-Top Scoring Pairs (kTSP) algorithms utilize in-sample gene expression feature pair rules for class prediction, and have demonstrated excellent performance and robustness. The available packages and tools primarily focus on binary prediction (i.e. two classes). However, many real-world classification problems e.g. tumor subtype prediction, are multiclass tasks.

RESULTS

Here, we present multiclassPairs, an R package to train pair-based single sample classifiers for multiclass problems. multiclassPairs offers two main methods to build multiclass prediction models, either using a one-versus-rest kTSP scheme or through a novel pair-based Random Forest approach. The package also provides options for dealing with class imbalances, multiplatform training, missing features in test data and visualization of training and test results.

AVAILABILITY AND IMPLEMENTATION

'multiclassPairs' package is available on CRAN servers and GitHub: https://github.com/NourMarzouka/multiclassPairs.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

k-最佳配对(kTSP)算法利用样本内基因表达特征对规则进行分类预测,已证明具有出色的性能和稳健性。现有的软件包和工具主要侧重于二分类预测(即两类)。然而,许多现实世界中的分类问题,例如肿瘤亚型预测,都是多类任务。

结果

这里,我们提出了 multiclassPairs,这是一个用于多类问题的基于配对的单样本分类器的 R 包。multiclassPairs 提供了两种主要的方法来构建多类预测模型,一种是使用一对一 kTSP 方案,另一种是通过新颖的基于配对的随机森林方法。该软件包还提供了处理类不平衡、多平台训练、测试数据中缺失特征以及可视化训练和测试结果的选项。

可用性和实现

multiclassPairs 软件包可在 CRAN 服务器和 GitHub 上获得:https://github.com/NourMarzouka/multiclassPairs。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cb4f/8479681/0f3565b339e3/btab088f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cb4f/8479681/0f3565b339e3/btab088f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cb4f/8479681/0f3565b339e3/btab088f1.jpg

相似文献

1
multiclassPairs: an R package to train multiclass pair-based classifier.multiclassPairs:一个用于训练多类基于对的分类器的 R 包。
Bioinformatics. 2021 Sep 29;37(18):3043-3044. doi: 10.1093/bioinformatics/btab088.
2
A comparison of rule-based and centroid single-sample multiclass predictors for transcriptomic classification.基于规则和质心单样本多类预测器在转录组分类中的比较。
Bioinformatics. 2022 Jan 27;38(4):1022-1029. doi: 10.1093/bioinformatics/btab763.
3
switchBox: an R package for k-Top Scoring Pairs classifier development.开关盒:一个用于开发k-高分对分类器的R软件包。
Bioinformatics. 2015 Jan 15;31(2):273-4. doi: 10.1093/bioinformatics/btu622. Epub 2014 Sep 26.
4
Machine learning algorithms for outcome prediction in (chemo)radiotherapy: An empirical comparison of classifiers.机器学习算法在(放化疗)治疗结果预测中的应用:分类器的实证比较。
Med Phys. 2018 Jul;45(7):3449-3459. doi: 10.1002/mp.12967. Epub 2018 Jun 13.
5
MetaKTSP: a meta-analytic top scoring pair method for robust cross-study validation of omics prediction analysis.MetaKTSP:一种用于组学预测分析的稳健跨研究验证的元分析最高得分对方法。
Bioinformatics. 2016 Jul 1;32(13):1966-73. doi: 10.1093/bioinformatics/btw115. Epub 2016 Mar 2.
6
(, )-mer-a simple statistical feature for sequence classification.(, )-mer——一种用于序列分类的简单统计特征。
Bioinform Adv. 2023 Jul 11;3(1):vbad088. doi: 10.1093/bioadv/vbad088. eCollection 2023.
7
HieRFIT: a hierarchical cell type classification tool for projections from complex single-cell atlas datasets.HieRFIT:一种用于复杂单细胞图谱数据集投影的层次细胞类型分类工具。
Bioinformatics. 2021 Dec 7;37(23):4431-4436. doi: 10.1093/bioinformatics/btab499.
8
MorphoTools2: an R package for multivariate morphometric analysis.MorphoTools2:一个用于多元形态计量分析的 R 包。
Bioinformatics. 2022 May 13;38(10):2954-2955. doi: 10.1093/bioinformatics/btac173.
9
Software application profile: tpc and micd-R packages for causal discovery with incomplete cohort data.软件应用程序简介:用于不完全队列数据因果发现的 tpc 和 micd-R 包。
Int J Epidemiol. 2024 Aug 14;53(5). doi: 10.1093/ije/dyae113.
10
Genefu: an R/Bioconductor package for computation of gene expression-based signatures in breast cancer.Genefu:一个用于计算基于基因表达的乳腺癌特征的R/Bioconductor软件包。
Bioinformatics. 2016 Apr 1;32(7):1097-9. doi: 10.1093/bioinformatics/btv693. Epub 2015 Nov 24.

引用本文的文献

1
OncoTrace-TOO: Interpretable Machine Learning Framework for Cancer Tissue-of-Origin Identification Using Transcriptomic Signatures.OncoTrace-TOO:使用转录组特征识别癌症组织起源的可解释机器学习框架。
Cancer Rep (Hoboken). 2025 Aug;8(8):e70311. doi: 10.1002/cnr2.70311.
2
Applications of gene pair methods in clinical research: advancing precision medicine.基因对方法在临床研究中的应用:推动精准医学发展。
Mol Biomed. 2025 Apr 9;6(1):22. doi: 10.1186/s43556-025-00263-w.
3
Robust Cluster Prediction Across Data Types Validates Association of Sex and Therapy Response in GBM.
跨数据类型的稳健聚类预测验证了胶质母细胞瘤中性别与治疗反应的关联。
Cancers (Basel). 2025 Jan 28;17(3):445. doi: 10.3390/cancers17030445.
4
Classification of non-TCGA cancer samples to TCGA molecular subtypes using compact feature sets.使用紧凑特征集将非TCGA癌症样本分类为TCGA分子亚型。
Cancer Cell. 2025 Feb 10;43(2):195-212.e11. doi: 10.1016/j.ccell.2024.12.002. Epub 2025 Jan 2.
5
Tracing unknown tumor origins with a biological-pathway-based transformer model.基于生物途径的变换模型追踪未知肿瘤起源。
Cell Rep Methods. 2024 Jun 17;4(6):100797. doi: 10.1016/j.crmeth.2024.100797.
6
Metabolic pathway-based subtypes associate glycan biosynthesis and treatment response in head and neck cancer.基于代谢途径的亚型与头颈部癌症中的聚糖生物合成及治疗反应相关。
NPJ Precis Oncol. 2024 May 23;8(1):116. doi: 10.1038/s41698-024-00602-0.
7
ITree: a user-driven tool for interactive decision-making with classification trees.ITree:一个用户驱动的分类树交互式决策工具。
Bioinformatics. 2024 May 2;40(5). doi: 10.1093/bioinformatics/btae273.
8
Stage-stratified molecular profiling of non-muscle-invasive bladder cancer enhances biological, clinical, and therapeutic insight.对非肌肉浸润性膀胱癌进行分层分子谱分析可增强生物学、临床和治疗方面的认识。
Cell Rep Med. 2021 Dec 21;2(12):100472. doi: 10.1016/j.xcrm.2021.100472.