• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ChemmineR:用于R语言的化合物挖掘框架。

ChemmineR: a compound mining framework for R.

作者信息

Cao Yiqun, Charisi Anna, Cheng Li-Chang, Jiang Tao, Girke Thomas

机构信息

Department of Computer Science and Engineering, University of California, Riverside, California, USA.

出版信息

Bioinformatics. 2008 Aug 1;24(15):1733-4. doi: 10.1093/bioinformatics/btn307. Epub 2008 Jul 2.

DOI:10.1093/bioinformatics/btn307
PMID:18596077
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2638865/
Abstract

MOTIVATION

Software applications for structural similarity searching and clustering of small molecules play an important role in drug discovery and chemical genomics. Here, we present the first open-source compound mining framework for the popular statistical programming environment R. The integration with a powerful statistical environment maximizes the flexibility, expandability and programmability of the provided analysis functions.

RESULTS

We discuss the algorithms and compound mining utilities provided by the R package ChemmineR. It contains functions for structural similarity searching, clustering of compound libraries with a wide spectrum of classification algorithms and various utilities for managing complex compound data. It also offers a wide range of visualization functions for compound clusters and chemical structures. The package is well integrated with the online ChemMine environment and allows bidirectional communications between the two services.

AVAILABILITY

ChemmineR is freely available as an R package from the ChemMine project site: http://bioweb.ucr.edu/ChemMineV2/chemminer

摘要

动机

用于小分子结构相似性搜索和聚类的软件应用在药物发现和化学基因组学中发挥着重要作用。在此,我们为流行的统计编程环境R展示了首个开源化合物挖掘框架。与强大的统计环境集成可最大化所提供分析功能的灵活性、可扩展性和可编程性。

结果

我们讨论了R包ChemmineR提供的算法和化合物挖掘实用工具。它包含用于结构相似性搜索的函数、使用多种分类算法对化合物库进行聚类的函数以及用于管理复杂化合物数据的各种实用工具。它还为化合物簇和化学结构提供了广泛的可视化功能。该包与在线ChemMine环境良好集成,并允许这两种服务之间进行双向通信。

可用性

ChemmineR作为一个R包可从ChemMine项目网站免费获取:http://bioweb.ucr.edu/ChemMineV2/chemminer

相似文献

1
ChemmineR: a compound mining framework for R.ChemmineR:用于R语言的化合物挖掘框架。
Bioinformatics. 2008 Aug 1;24(15):1733-4. doi: 10.1093/bioinformatics/btn307. Epub 2008 Jul 2.
2
ChemMine tools: an online service for analyzing and clustering small molecules.ChemMine 工具:一种用于分析和聚类小分子的在线服务。
Nucleic Acids Res. 2011 Jul;39(Web Server issue):W486-91. doi: 10.1093/nar/gkr320. Epub 2011 May 16.
3
ARIA2: automated NOE assignment and data integration in NMR structure calculation.ARIA2:核磁共振结构计算中的自动核Overhauser效应(NOE)归属与数据整合
Bioinformatics. 2007 Feb 1;23(3):381-2. doi: 10.1093/bioinformatics/btl589. Epub 2006 Nov 22.
4
MARVIN: a medical research application framework based on open source software.MARVIN:一个基于开源软件的医学研究应用框架。
Comput Methods Programs Biomed. 2008 Aug;91(2):165-74. doi: 10.1016/j.cmpb.2008.04.007. Epub 2008 Jun 9.
5
BioLingua: a programmable knowledge environment for biologists.BioLingua:面向生物学家的可编程知识环境。
Bioinformatics. 2005 Jan 15;21(2):199-207. doi: 10.1093/bioinformatics/bth465. Epub 2004 Aug 12.
6
SChiSM2: creating interactive web page annotations of molecular structure models using Jmol.SChiSM2:使用Jmol创建分子结构模型的交互式网页注释。
Bioinformatics. 2007 Feb 1;23(3):383-4. doi: 10.1093/bioinformatics/btl603. Epub 2007 Jan 3.
7
ClusterControl: a web interface for distributing and monitoring bioinformatics applications on a Linux cluster.集群控制:用于在Linux集群上分发和监控生物信息学应用程序的Web界面。
Bioinformatics. 2004 Mar 22;20(5):805-7. doi: 10.1093/bioinformatics/bth014. Epub 2004 Jan 29.
8
Intelligible machine learning with malibu.使用马里布的可理解机器学习。
Annu Int Conf IEEE Eng Med Biol Soc. 2008;2008:3795-8. doi: 10.1109/IEMBS.2008.4650035.
9
BIAS: Bioinformatics Integrated Application Software.BIAS:生物信息学集成应用软件。
Bioinformatics. 2005 Apr 15;21(8):1745-6. doi: 10.1093/bioinformatics/bti170. Epub 2004 Nov 30.
10
Rintact: enabling computational analysis of molecular interaction data from the IntAct repository.Rintact:实现对来自IntAct数据库的分子相互作用数据的计算分析。
Bioinformatics. 2008 Apr 15;24(8):1100-1. doi: 10.1093/bioinformatics/btm518. Epub 2007 Nov 7.

引用本文的文献

1
Integrated genome mining and molecular networking uncover the biosynthetic potential of a novel mangrove-derived strain Streptomyces sp. B1866.整合基因组挖掘和分子网络揭示了一种源自红树林的新型链霉菌菌株Streptomyces sp. B1866的生物合成潜力。
BMC Genomics. 2025 Aug 20;26(1):762. doi: 10.1186/s12864-025-11966-3.
2
Enantioseparation of Proton Pump Inhibitors by HPLC on Polysaccharide-Type Stationary Phases: Enantiomer Elution Order Reversal, Thermodynamic Characterization, and Hysteretic Effect.基于多糖型固定相的高效液相色谱法对质子泵抑制剂的对映体拆分:对映体洗脱顺序反转、热力学表征及滞后效应
Int J Mol Sci. 2025 Jul 25;26(15):7217. doi: 10.3390/ijms26157217.
3
NfκBin: a machine learning based method for screening TNF-α induced NF-κB inhibitors.NfκBin:一种基于机器学习的筛选肿瘤坏死因子-α诱导的核因子-κB抑制剂的方法。
Front Bioinform. 2025 Jul 17;5:1573744. doi: 10.3389/fbinf.2025.1573744. eCollection 2025.
4
Improving Spectral Similarity and Molecular Network Reliability through Noise Signal Filtering in MS/MS Spectra.通过对MS/MS谱图中的噪声信号进行滤波来提高谱图相似度和分子网络可靠性
Anal Chem. 2025 Jul 29;97(29):15873-15882. doi: 10.1021/acs.analchem.5c02109. Epub 2025 Jul 17.
5
Unsupervised learning reveals landscape of local structural motifs across protein classes.无监督学习揭示了跨蛋白质类别的局部结构基序格局。
Bioinformatics. 2025 Jul 1;41(7). doi: 10.1093/bioinformatics/btaf377.
6
Cheminformatics Approaches to the Analysis of Additives for Sustainable Polymeric Materials.用于可持续聚合物材料添加剂分析的化学信息学方法
Polymers (Basel). 2025 May 29;17(11):1522. doi: 10.3390/polym17111522.
7
Unusually Broad-spectrum small-molecule sensing using a single protein scaffold.利用单一蛋白质支架实现异常广谱的小分子传感。
bioRxiv. 2025 May 15:2025.05.15.654352. doi: 10.1101/2025.05.15.654352.
8
Small-molecule screen in C. elegans identifies benzenesulfonamides as inhibitors of microsporidia spores.秀丽隐杆线虫中的小分子筛选确定苯磺酰胺为微孢子虫孢子的抑制剂。
NPJ Antimicrob Resist. 2025 May 21;3(1):41. doi: 10.1038/s44259-025-00116-0.
9
Data- and knowledge-derived functional landscape of human solute carriers.人类溶质载体的数据与知识衍生功能图谱
Mol Syst Biol. 2025 May 12. doi: 10.1038/s44320-025-00108-2.
10
Untargeted Metabolomic Analysis and Cytotoxicity of Extracts of the Marine Dinoflagellate Against Human Cancer Cell Lines.海洋甲藻提取物对人癌细胞系的非靶向代谢组学分析及细胞毒性
Toxins (Basel). 2025 Mar 21;17(4):150. doi: 10.3390/toxins17040150.

本文引用的文献

1
Pybel: a Python wrapper for the OpenBabel cheminformatics toolkit.Pybel:用于OpenBabel化学信息学工具包的Python包装器。
Chem Cent J. 2008 Mar 9;2:5. doi: 10.1186/1752-153X-2-5.
2
ChemBank: a small-molecule screening and cheminformatics resource database.化学文库:一个小分子筛选与化学信息学资源数据库。
Nucleic Acids Res. 2008 Jan;36(Database issue):D351-9. doi: 10.1093/nar/gkm843. Epub 2007 Oct 18.
3
QSAR--how good is it in practice? Comparison of descriptor sets on an unbiased cross section of corporate data sets.定量构效关系——在实际应用中效果如何?企业数据集无偏横截面描述符集的比较。
J Chem Inf Model. 2006 Sep-Oct;46(5):1924-36. doi: 10.1021/ci050413p.
4
The Blue Obelisk-interoperability in chemical informatics.蓝色方尖碑——化学信息学中的互操作性。
J Chem Inf Model. 2006 May-Jun;46(3):991-8. doi: 10.1021/ci050400b.
5
ChemDB: a public database of small molecules and related chemoinformatics resources.化学数据库(ChemDB):一个小分子及相关化学信息学资源的公共数据库。
Bioinformatics. 2005 Nov 15;21(22):4133-9. doi: 10.1093/bioinformatics/bti683. Epub 2005 Sep 20.
6
ChemMine. A compound mining database for chemical genomics.ChemMine。一个用于化学基因组学的化合物挖掘数据库。
Plant Physiol. 2005 Jun;138(2):573-7. doi: 10.1104/pp.105.062687.
7
ZINC--a free database of commercially available compounds for virtual screening.锌数据库——一个可用于虚拟筛选的商业可用化合物免费数据库。
J Chem Inf Model. 2005 Jan-Feb;45(1):177-82. doi: 10.1021/ci049714+.
8
Analysis and display of the size dependence of chemical similarity coefficients.化学相似系数的尺寸依赖性分析与展示。
J Chem Inf Comput Sci. 2003 May-Jun;43(3):819-28. doi: 10.1021/ci034001x.
9
Performance of similarity measures in 2D fragment-based similarity searching: comparison of structural descriptors and similarity coefficients.二维基于片段的相似性搜索中相似性度量的性能:结构描述符和相似性系数的比较
J Chem Inf Comput Sci. 2002 Nov-Dec;42(6):1407-14. doi: 10.1021/ci025531g.
10
Heuristics for similarity searching of chemical graphs using a maximum common edge subgraph algorithm.使用最大公共边子图算法进行化学图相似性搜索的启发式方法。
J Chem Inf Comput Sci. 2002 Mar-Apr;42(2):305-16. doi: 10.1021/ci010381f.