• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

墨卡托投影法:一种用于多方法、无监督可视化和距离生成的管道。

Mercator: a pipeline for multi-method, unsupervised visualization and distance generation.

作者信息

Abrams Zachary B, Coombes Caitlin E, Li Suli, Coombes Kevin R

机构信息

Department of Biomedical Informatics, The Ohio State University, Columbus, OH 43210, USA.

College of Medicine, The Ohio State University, Columbus, OH 43210, USA.

出版信息

Bioinformatics. 2021 Sep 9;37(17):2780-2781. doi: 10.1093/bioinformatics/btab037.

DOI:10.1093/bioinformatics/btab037
PMID:33515233
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8428582/
Abstract

SUMMARY

Unsupervised machine learning provides tools for researchers to uncover latent patterns in large-scale data, based on calculated distances between observations. Methods to visualize high-dimensional data based on these distances can elucidate subtypes and interactions within multi-dimensional and high-throughput data. However, researchers can select from a vast number of distance metrics and visualizations, each with their own strengths and weaknesses. The Mercator R package facilitates selection of a biologically meaningful distance from 10 metrics, together appropriate for binary, categorical and continuous data, and visualization with 5 standard and high-dimensional graphics tools. Mercator provides a user-friendly pipeline for informaticians or biologists to perform unsupervised analyses, from exploratory pattern recognition to production of publication-quality graphics.

AVAILABILITYAND IMPLEMENTATION

Mercator is freely available at the Comprehensive R Archive Network (https://cran.r-project.org/web/packages/Mercator/index.html).

摘要

摘要

无监督机器学习为研究人员提供了工具,使其能够基于观测值之间的计算距离,在大规模数据中发现潜在模式。基于这些距离对高维数据进行可视化的方法,可以阐明多维和高通量数据中的亚型及相互作用。然而,研究人员可以从大量距离度量和可视化方法中进行选择,每种方法都有其优缺点。Mercator R包有助于从10种度量中选择具有生物学意义的距离,这些度量共同适用于二元、分类和连续数据,并可使用5种标准和高维图形工具进行可视化。Mercator为信息学家或生物学家提供了一个用户友好的管道,用于执行无监督分析,从探索性模式识别到生成可用于发表的高质量图形。

可用性和实现方式

Mercator可在综合R存档网络(https://cran.r-project.org/web/packages/Mercator/index.html)上免费获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/28dc/8428582/9a4be64719aa/btab037f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/28dc/8428582/9a4be64719aa/btab037f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/28dc/8428582/9a4be64719aa/btab037f1.jpg

相似文献

1
Mercator: a pipeline for multi-method, unsupervised visualization and distance generation.墨卡托投影法:一种用于多方法、无监督可视化和距离生成的管道。
Bioinformatics. 2021 Sep 9;37(17):2780-2781. doi: 10.1093/bioinformatics/btab037.
2
SmCCNet 2.0: A Comprehensive Tool for Multi-omics Network Inference with Shiny Visualization.SmCCNet 2.0:一款具备闪亮可视化功能的用于多组学网络推断的综合工具。
bioRxiv. 2024 Apr 7:2023.11.20.567893. doi: 10.1101/2023.11.20.567893.
3
Smccnet 2.0: a comprehensive tool for multi-omics network inference with shiny visualization.Smccnet 2.0:一个具有 shiny 可视化功能的用于多组学网络推断的综合工具。
BMC Bioinformatics. 2024 Aug 24;25(1):276. doi: 10.1186/s12859-024-05900-9.
4
BinMat: A molecular genetics tool for processing binary data obtained from fragment analysis in R.BinMat:一种用于处理在R中通过片段分析获得的二进制数据的分子遗传学工具。
Biodivers Data J. 2022 Mar 11;10:e77875. doi: 10.3897/BDJ.10.e77875. eCollection 2022.
5
circlize Implements and enhances circular visualization in R.circlize在R语言中实现并增强了圆形可视化。
Bioinformatics. 2014 Oct;30(19):2811-2. doi: 10.1093/bioinformatics/btu393. Epub 2014 Jun 14.
6
spiralize: an R package for visualizing data on spirals.螺旋化:一个用于可视化螺旋数据的 R 包。
Bioinformatics. 2022 Feb 7;38(5):1434-1436. doi: 10.1093/bioinformatics/btab778.
7
Visually guided preprocessing of bioanalytical laboratory data using an interactive R notebook (pguIMP).使用交互式 R 笔记本(pguIMP)对生物分析实验室数据进行可视化引导的预处理。
CPT Pharmacometrics Syst Pharmacol. 2021 Nov;10(11):1371-1381. doi: 10.1002/psp4.12704. Epub 2021 Oct 1.
8
ExplaineR: an R package to explain machine learning models.ExplaineR:一个用于解释机器学习模型的R包。
Bioinform Adv. 2024 Mar 26;4(1):vbae049. doi: 10.1093/bioadv/vbae049. eCollection 2024.
9
ggseqlogo: a versatile R package for drawing sequence logos.ggseqlogo:一个用于绘制序列 logo 的多功能 R 包。
Bioinformatics. 2017 Nov 15;33(22):3645-3647. doi: 10.1093/bioinformatics/btx469.
10
bdvis: visualizing biodiversity data in R.bdvis:在 R 中可视化生物多样性数据。
Bioinformatics. 2016 Oct 1;32(19):3049-50. doi: 10.1093/bioinformatics/btw333. Epub 2016 Jun 10.

引用本文的文献

1
Topological Structures in the Space of Treatment-Naïve Patients with Chronic Lymphocytic Leukemia.初治慢性淋巴细胞白血病患者空间中的拓扑结构
Cancers (Basel). 2024 Jul 26;16(15):2662. doi: 10.3390/cancers16152662.
2
RCytoGPS: an R package for reading and visualizing cytogenetics data.RCytoGPS:一个用于读取和可视化细胞遗传学数据的 R 包。
Bioinformatics. 2021 Dec 7;37(23):4589-4590. doi: 10.1093/bioinformatics/btab683.
3
Simulation-derived best practices for clustering clinical data.基于模拟的临床数据聚类最佳实践。
J Biomed Inform. 2021 Jun;118:103788. doi: 10.1016/j.jbi.2021.103788. Epub 2021 Apr 20.