• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Sstack:一个用于堆叠的R包,适用于涉及顺序添加样本和特征的场景。

Sstack: an R package for stacking with applications to scenarios involving sequential addition of samples and features.

作者信息

Matlock Kevin, Rahman Raziur, Ghosh Souparno, Pal Ranadip

机构信息

Department of Electrical and Computer Engineering.

Department of Mathematics and Statistics, Texas Tech University, Lubbock, TX, USA.

出版信息

Bioinformatics. 2019 Sep 1;35(17):3143-3145. doi: 10.1093/bioinformatics/btz010.

DOI:10.1093/bioinformatics/btz010
PMID:30649230
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6736036/
Abstract

SUMMARY

Biological processes are characterized by a variety of different genomic feature sets. However, often times when building models, portions of these features are missing for a subset of the dataset. We provide a modeling framework to effectively integrate this type of heterogeneous data to improve prediction accuracy. To test our methodology, we have stacked data from the Cancer Cell Line Encyclopedia to increase the accuracy of drug sensitivity prediction. The package addresses the dynamic regime of information integration involving sequential addition of features and samples.

AVAILABILITY AND IMPLEMENTATION

The framework has been implemented as a R package Sstack, which can be downloaded from https://cran.r-project.org/web/packages/Sstack/index.html, where further explanation of the package is available.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

生物过程由多种不同的基因组特征集所表征。然而,在构建模型时,数据集中的一部分样本常常会缺失这些特征的某些部分。我们提供了一个建模框架,以有效地整合这类异构数据,从而提高预测准确性。为了测试我们的方法,我们堆叠了来自癌症细胞系百科全书的数据,以提高药物敏感性预测的准确性。该软件包解决了信息整合的动态机制,包括特征和样本的顺序添加。

可用性和实现方式

该框架已作为R软件包Sstack实现,可从https://cran.r-project.org/web/packages/Sstack/index.html下载,在该网站上可获得该软件包的进一步说明。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
Sstack: an R package for stacking with applications to scenarios involving sequential addition of samples and features.Sstack:一个用于堆叠的R包,适用于涉及顺序添加样本和特征的场景。
Bioinformatics. 2019 Sep 1;35(17):3143-3145. doi: 10.1093/bioinformatics/btz010.
2
IntegratedMRF: random forest-based framework for integrating prediction from different data types.集成MRF:基于随机森林的框架,用于整合来自不同数据类型的预测。
Bioinformatics. 2017 May 1;33(9):1407-1410. doi: 10.1093/bioinformatics/btw765.
3
DNAshapeR: an R/Bioconductor package for DNA shape prediction and feature encoding.DNAshapeR:一个用于DNA形状预测和特征编码的R/Bioconductor软件包。
Bioinformatics. 2016 Apr 15;32(8):1211-3. doi: 10.1093/bioinformatics/btv735. Epub 2015 Dec 14.
4
Rediscover: an R package to identify mutually exclusive mutations.Rediscover:一个用于识别互斥突变的 R 包。
Bioinformatics. 2022 Jan 12;38(3):844-845. doi: 10.1093/bioinformatics/btab709.
5
TCGA2STAT: simple TCGA data access for integrated statistical analysis in R.TCGA2STAT:用于 R 中集成统计分析的简单 TCGA 数据访问。
Bioinformatics. 2016 Mar 15;32(6):952-4. doi: 10.1093/bioinformatics/btv677. Epub 2015 Nov 14.
6
Spathial: an R package for the evolutionary analysis of biological data.Spathial:用于生物数据进化分析的 R 包。
Bioinformatics. 2020 Nov 1;36(17):4664-4667. doi: 10.1093/bioinformatics/btaa273.
7
myTAI: evolutionary transcriptomics with R.我的TAI:使用R进行进化转录组学研究
Bioinformatics. 2018 May 1;34(9):1589-1590. doi: 10.1093/bioinformatics/btx835.
8
synbreed: a framework for the analysis of genomic prediction data using R.synbreed:一个使用 R 进行基因组预测数据分析的框架。
Bioinformatics. 2012 Aug 1;28(15):2086-7. doi: 10.1093/bioinformatics/bts335. Epub 2012 Jun 10.
9
PINSPlus: a tool for tumor subtype discovery in integrated genomic data.PINSPlus:一种整合基因组数据中肿瘤亚型发现的工具。
Bioinformatics. 2019 Aug 15;35(16):2843-2846. doi: 10.1093/bioinformatics/bty1049.
10
cit: hypothesis testing software for mediation analysis in genomic applications.引用:基因组应用中介分析的假设检验软件。
Bioinformatics. 2016 Aug 1;32(15):2364-5. doi: 10.1093/bioinformatics/btw135. Epub 2016 Mar 9.

本文引用的文献

1
Investigation of model stacking for drug sensitivity prediction.药物敏感性预测模型堆叠的研究。
BMC Bioinformatics. 2018 Mar 21;19(Suppl 3):71. doi: 10.1186/s12859-018-2060-2.
2
Heterogeneity Aware Random Forest for Drug Sensitivity Prediction.基于异质信息感知的随机森林药物敏感性预测模型。
Sci Rep. 2017 Sep 12;7(1):11347. doi: 10.1038/s41598-017-11665-4.
3
Characterization of Human Cancer Cell Lines by Reverse-phase Protein Arrays.利用反相蛋白质阵列对人癌细胞系进行表征
Cancer Cell. 2017 Feb 13;31(2):225-239. doi: 10.1016/j.ccell.2017.01.005.
4
The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity.癌症细胞系百科全书使对抗癌药物敏感性的预测建模成为可能。
Nature. 2012 Mar 28;483(7391):603-7. doi: 10.1038/nature11003.
5
Missing value imputation for gene expression data: computational techniques to recover missing data from available information.基因表达数据的缺失值填补:从现有信息中恢复缺失数据的计算技术。
Brief Bioinform. 2011 Sep;12(5):498-513. doi: 10.1093/bib/bbq080. Epub 2010 Dec 14.