• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

AutoClassWeb:一个用于组学数据贝叶斯聚类的简单 Web 界面。

AutoClassWeb: a simple web interface for Bayesian clustering of omics data.

机构信息

Université Paris Cité, CNRS, Institut Jacques Monod, Paris, F-75013, France.

出版信息

BMC Res Notes. 2022 Jul 7;15(1):241. doi: 10.1186/s13104-022-06129-6.

DOI:10.1186/s13104-022-06129-6
PMID:35799281
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9264669/
Abstract

OBJECTIVE

Data clustering is a common exploration step in the omics era, notably in genomics and proteomics where many genes or proteins can be quantified from one or more experiments. Bayesian clustering is a powerful unsupervised algorithm that can classify several thousands of genes or proteins. AutoClass C, its original implementation, handles missing data, automatically determines the best number of clusters but is not user-friendly.

RESULTS

We developed an online tool called AutoClassWeb, which provides an easy-to-use and simple web interface for Bayesian clustering with AutoClass. Input data are entered as TSV files and quality controlled. Results are provided in formats that ease further analyses with spreadsheet programs or with programming languages, such as Python or R. AutoClassWeb is implemented in Python and is published under the 3-Clauses BSD license. The source code is available at https://github.com/pierrepo/autoclassweb along with a detailed documentation.

摘要

目的

数据聚类是组学时代(尤其是在基因组学和蛋白质组学中)常用的探索步骤,在这些领域中,可以从一个或多个实验中定量测量许多基因或蛋白质。贝叶斯聚类是一种强大的无监督算法,可以对数千个基因或蛋白质进行分类。其原始实现 AutoClass C 可以处理缺失数据,自动确定最佳聚类数,但用户友好性较差。

结果

我们开发了一个名为 AutoClassWeb 的在线工具,它为 AutoClass 的贝叶斯聚类提供了一个易于使用和简单的 Web 界面。输入数据以 TSV 文件形式输入,并进行质量控制。结果以易于使用电子表格程序或编程语言(如 Python 或 R)进一步分析的格式提供。AutoClassWeb 是用 Python 实现的,并根据 3 条款 BSD 许可证发布。源代码可在 https://github.com/pierrepo/autoclassweb 上获得,同时还提供了详细的文档。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb4d/9264669/e2f238779693/13104_2022_6129_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb4d/9264669/4291e5d10fc5/13104_2022_6129_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb4d/9264669/e2f238779693/13104_2022_6129_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb4d/9264669/4291e5d10fc5/13104_2022_6129_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb4d/9264669/e2f238779693/13104_2022_6129_Fig2_HTML.jpg

相似文献

1
AutoClassWeb: a simple web interface for Bayesian clustering of omics data.AutoClassWeb:一个用于组学数据贝叶斯聚类的简单 Web 界面。
BMC Res Notes. 2022 Jul 7;15(1):241. doi: 10.1186/s13104-022-06129-6.
2
AutoClass@IJM: a powerful tool for Bayesian classification of heterogeneous data in biology.AutoClass@IJM:生物学中用于异质数据贝叶斯分类的强大工具。
Nucleic Acids Res. 2009 Jul;37(Web Server issue):W63-7. doi: 10.1093/nar/gkp430. Epub 2009 May 27.
3
Analysing high-throughput sequencing data in Python with HTSeq 2.0.用 HTSeq 2.0 分析 Python 中的高通量测序数据。
Bioinformatics. 2022 May 13;38(10):2943-2945. doi: 10.1093/bioinformatics/btac166.
4
Open source clustering software.开源聚类软件。
Bioinformatics. 2004 Jun 12;20(9):1453-4. doi: 10.1093/bioinformatics/bth078. Epub 2004 Feb 10.
5
scDIOR: single cell RNA-seq data IO software.scDIOR:单细胞 RNA-seq 数据输入输出软件。
BMC Bioinformatics. 2022 Jan 6;23(1):16. doi: 10.1186/s12859-021-04528-3.
6
psims - A Declarative Writer for mzML and mzIdentML for Python.psims - 用于 Python 的 mzML 和 mzIdentML 的声明式编写器。
Mol Cell Proteomics. 2019 Mar;18(3):571-575. doi: 10.1074/mcp.RP118.001070. Epub 2018 Dec 18.
7
LocusExplorer: a user-friendly tool for integrated visualization of human genetic association data and biological annotations.LocusExplorer:一款用于人类基因关联数据和生物学注释综合可视化的用户友好型工具。
Bioinformatics. 2016 Mar 15;32(6):949-51. doi: 10.1093/bioinformatics/btv690. Epub 2015 Nov 20.
8
SIMBSIG: similarity search and clustering for biobank-scale data.SIMBSIG:用于生物库规模数据的相似性搜索和聚类。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac829.
9
Comb-p: software for combining, analyzing, grouping and correcting spatially correlated P-values.ComP:用于合并、分析、分组和校正空间相关 P 值的软件。
Bioinformatics. 2012 Nov 15;28(22):2986-8. doi: 10.1093/bioinformatics/bts545. Epub 2012 Sep 5.
10
pyGROMODS: a Python package for the generation of input files for molecular dynamic simulation with GROMACS.pyGROMODS:一个用于使用 GROMACS 生成分子动力学模拟输入文件的 Python 包。
J Biomol Struct Dyn. 2024 Sep;42(14):7207-7220. doi: 10.1080/07391102.2023.2239929. Epub 2023 Jul 24.

本文引用的文献

1
The adaptive response to iron involves changes in energetic strategies in the pathogen Candida albicans.铁的适应性反应涉及病原体白色念珠菌中能量策略的变化。
Microbiologyopen. 2020 Feb;9(2):e970. doi: 10.1002/mbo3.970. Epub 2019 Dec 1.
2
Serotonin Differentially Regulates L5 Pyramidal Cell Classes of the Medial Prefrontal Cortex in Rats and Mice.5-羟色胺在大鼠和小鼠中差异调节内侧前额叶皮层 L5 锥体神经元的细胞类型。
eNeuro. 2018 Feb 6;5(1). doi: 10.1523/ENEURO.0305-17.2018. eCollection 2018 Jan-Feb.
3
BioContainers: an open-source and community-driven framework for software standardization.
生物容器:一个开源且由社区驱动的软件标准化框架。
Bioinformatics. 2017 Aug 15;33(16):2580-2582. doi: 10.1093/bioinformatics/btx192.
4
The control of tomato fruit elongation orchestrated by sun, ovate and fs8.1 in a wild relative of tomato.番茄野生近缘种中,番茄 fs8.1、卵形基因和 SUN 基因共同调控果实伸长。
Plant Sci. 2015 Sep;238:95-104. doi: 10.1016/j.plantsci.2015.05.019. Epub 2015 Jun 9.
5
The metacaspase (Mca1p) has a dual role in farnesol-induced apoptosis in Candida albicans.在白色念珠菌中, metacaspase(Mca1p)在法尼醇诱导的细胞凋亡中具有双重作用。
Mol Cell Proteomics. 2015 Jan;14(1):93-108. doi: 10.1074/mcp.M114.041210. Epub 2014 Oct 27.
6
AutoClass@IJM: a powerful tool for Bayesian classification of heterogeneous data in biology.AutoClass@IJM:生物学中用于异质数据贝叶斯分类的强大工具。
Nucleic Acids Res. 2009 Jul;37(Web Server issue):W63-7. doi: 10.1093/nar/gkp430. Epub 2009 May 27.
7
Java Treeview--extensible visualization of microarray data.Java树状视图——微阵列数据的可扩展可视化工具。
Bioinformatics. 2004 Nov 22;20(17):3246-8. doi: 10.1093/bioinformatics/bth349. Epub 2004 Jun 4.
8
Identifying the structure in cuttlefish visual signals.识别乌贼视觉信号中的结构。
Philos Trans R Soc Lond B Biol Sci. 2002 Nov 29;357(1427):1617-24. doi: 10.1098/rstb.2002.1070.