Suppr超能文献

CiRCus:一种用于对复杂高通量实验进行分类的框架。

CiRCus: A Framework to Enable Classification of Complex High-Throughput Experiments.

机构信息

Chair of Proteomics and Bioanalytics , Technical University of Munich , Freising , Germany.

German Cancer Research Center and German Cancer, Consortium , Heidelberg , Germany.

出版信息

J Proteome Res. 2019 Apr 5;18(4):1486-1493. doi: 10.1021/acs.jproteome.8b00724. Epub 2019 Mar 22.

Abstract

Despite the increasing use of high-throughput experiments in molecular biology, methods for evaluating and classifying the acquired results have not kept pace, requiring significant manual efforts to do so. Here, we present CiRCus, a framework to generate custom machine learning models to classify results from high-throughput proteomics binding experiments. We show the experimental procedure that guided us to the layout of this framework as well as the usage of the framework on an example data set consisting of 557 166 protein/drug binding curves achieving an AUC of 0.9987. By applying our classifier to the data, only 6% of the data might require manual investigation. CiRCus bundles two applications, a minimal interface to label a training data set (CindeR) and an interface for the generation of random forest classifiers with optional optimization of pretrained models (CurveClassification). CiRCus is available on https://github.com/kusterlab accompanied by an in-depth user manual and video tutorial.

摘要

尽管在分子生物学中越来越多地使用高通量实验,但评估和分类所获得结果的方法并没有跟上,需要大量的人工努力才能做到这一点。在这里,我们介绍了 CiRCus,这是一个用于生成自定义机器学习模型以对高通量蛋白质组学结合实验结果进行分类的框架。我们展示了指导我们设计该框架的实验过程,以及在一个由 557166 条蛋白质/药物结合曲线组成的示例数据集上使用该框架的情况,该框架的 AUC 达到 0.9987。通过将我们的分类器应用于该数据集,只有 6%的数据可能需要手动调查。CiRCus 捆绑了两个应用程序,一个用于标记训练数据集的最小接口(CindeR)和一个用于生成随机森林分类器的接口,其中包括对预训练模型的优化(CurveClassification)。CiRCus 可在 https://github.com/kusterlab 上获得,同时提供详细的用户手册和视频教程。

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验