• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

EFGs:在RDKit中对Ertl功能团检测算法的完整准确实现。

EFGs: A Complete and Accurate Implementation of Ertl's Functional Group Detection Algorithm in RDKit.

作者信息

Colmenarejo Gonzalo

机构信息

Biostatistics and Bioinformatics Unit, IMDEA Food, E28049 Madrid, Spain.

出版信息

J Chem Inf Model. 2025 Feb 10;65(3):1061-1066. doi: 10.1021/acs.jcim.4c02268. Epub 2025 Jan 28.

DOI:10.1021/acs.jcim.4c02268
PMID:39876492
Abstract

Functional groups are widely used in organic chemistry, because they provide a rationale to analyze physicochemical and reactivity properties. In medicinal chemistry, they are the basis for analyzing ligand-biomacromolecule interactions. Ertl's algorithm is an approach to extract functional groups in arbitrary organic molecules that does not depend on predefined libraries of functional groups. However, there is a lack of a complete and accurate implementation of Ertl's algorithm in the widely used RDKit cheminformatic toolkit. In this paper, a new RDKit/Python implementation of the algorithm is described, that is both accurate and complete. For a RDKit molecule, it provides (i) a PNG binary string with an image of the molecule with color-highlighted functional groups; (ii) a list of sets of atom indices (idx), each set corresponding to a functional group; (iii) a list of pseudo-SMILES canonicalized strings for the full functional groups; and (iv) a list of RDKit labeled mol objects, one for each full functional group. The code is freely available in https://github.com/bbu-imdea/efgs and is part of the RDKit Contrib directory (https://github.com/rdkit/rdkit/tree/master/Contrib/efgs).

摘要

官能团在有机化学中被广泛使用,因为它们为分析物理化学性质和反应活性提供了理论依据。在药物化学中,它们是分析配体与生物大分子相互作用的基础。厄特尔算法是一种用于提取任意有机分子中官能团的方法,该方法不依赖于预定义的官能团库。然而,在广泛使用的RDKit化学信息学工具包中,缺乏对厄特尔算法完整且准确的实现。本文描述了该算法在RDKit/Python中的一种新实现,它既准确又完整。对于一个RDKit分子,它提供:(i) 一个PNG二进制字符串,其中包含带有颜色突出显示官能团的分子图像;(ii) 原子索引集 (idx) 的列表,每个集合对应一个官能团;(iii) 完整官能团的伪SMILES规范化字符串列表;以及(iv) RDKit标记的mol对象列表,每个完整官能团对应一个。该代码可在https://github.com/bbu-imdea/efgs上免费获取,并且是RDKit Contrib目录(https://github.com/rdkit/rdkit/tree/master/Contrib/efgs)的一部分。

相似文献

1
EFGs: A Complete and Accurate Implementation of Ertl's Functional Group Detection Algorithm in RDKit.EFGs:在RDKit中对Ertl功能团检测算法的完整准确实现。
J Chem Inf Model. 2025 Feb 10;65(3):1061-1066. doi: 10.1021/acs.jcim.4c02268. Epub 2025 Jan 28.
2
GUIDEMOL: A Python graphical user interface for molecular descriptors based on RDKit.GUIDEMOL:一个基于 RDKit 的分子描述符的 Python 图形用户界面。
Mol Inform. 2024 Jan;43(1):e202300190. doi: 10.1002/minf.202300190. Epub 2023 Nov 20.
3
rdScaffoldNetwork: The Scaffold Network Implementation in RDKit.rdScaffoldNetwork:RDKit 中的支架网络实现。
J Chem Inf Model. 2020 Jul 27;60(7):3331-3335. doi: 10.1021/acs.jcim.0c00296. Epub 2020 Jul 7.
4
Descriptor-Driven de Novo Design Algorithms for DOCK6 Using RDKit.基于 RDKit 的 DOCK6 的描述符驱动从头设计算法。
J Chem Inf Model. 2023 Sep 25;63(18):5803-5822. doi: 10.1021/acs.jcim.3c01031. Epub 2023 Sep 12.
5
MolPipeline: A Python Package for Processing Molecules with RDKit in Scikit-learn.MolPipeline:一个用于在Scikit-learn中使用RDKit处理分子的Python包。
J Chem Inf Model. 2024 Dec 23;64(24):9027-9033. doi: 10.1021/acs.jcim.4c00863. Epub 2024 Sep 17.
6
RDChiral: An RDKit Wrapper for Handling Stereochemistry in Retrosynthetic Template Extraction and Application.RDChiral:一个用于在逆合成模板提取和应用中处理立体化学的 RDKit 包装器。
J Chem Inf Model. 2019 Jun 24;59(6):2529-2537. doi: 10.1021/acs.jcim.9b00286. Epub 2019 Jun 13.
7
PySpark and RDKit: Moving towards Big Data in Cheminformatics.PySpark 和 RDKit:迈向化学生物信息学的大数据时代。
Mol Inform. 2019 Jun;38(6):e1800082. doi: 10.1002/minf.201800082. Epub 2019 Mar 7.
8
Get Your Atoms in Order--An Open-Source Implementation of a Novel and Robust Molecular Canonicalization Algorithm.整理原子顺序——一种新颖且强大的分子正则化算法的开源实现。
J Chem Inf Model. 2015 Oct 26;55(10):2111-20. doi: 10.1021/acs.jcim.5b00543. Epub 2015 Oct 15.
9
mmpdb: An Open-Source Matched Molecular Pair Platform for Large Multiproperty Data Sets.mmpdb:用于大型多属性数据集的开源匹配分子对平台。
J Chem Inf Model. 2018 May 29;58(5):902-910. doi: 10.1021/acs.jcim.8b00173. Epub 2018 May 17.
10
PDBe CCDUtils: an RDKit-based toolkit for handling and analysing small molecules in the Protein Data Bank.PDBe CCDUtils:一个基于RDKit的工具包,用于处理和分析蛋白质数据库中的小分子。
J Cheminform. 2023 Dec 2;15(1):117. doi: 10.1186/s13321-023-00786-w.