• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

拓扑相似性搜索在大型组合碎片空间中。

Topological Similarity Search in Large Combinatorial Fragment Spaces.

机构信息

ZBH-Center for Bioinformatics, Research Group for Computational Molecular Design, Universität Hamburg, Bundesstraβe 43, Hamburg 20146, Germany.

出版信息

J Chem Inf Model. 2021 Jan 25;61(1):238-251. doi: 10.1021/acs.jcim.0c00850. Epub 2020 Oct 21.

DOI:10.1021/acs.jcim.0c00850
PMID:33084338
Abstract

In similarity-driven virtual screening, molecular fingerprints are widely used to assess the similarity of all compounds contained in a chemical library to a query compound of interest. This similarity analysis is traditionally done for each member of the library individually. When encoding chemical spaces that surpass billions of compounds in size, it becomes impractical to enumerate all their products, let alone assess their similarity, deeming this approach impossible without investing a substantial amount of resources. In this work, we present a novel search algorithm named SpaceLight for topological fingerprint similarity searching in large, practically non-enumerable combinatorial fragment spaces. In contrast to existing methods, SpaceLight is able to utilize the combinatorial character of these chemical spaces for efficiency while maintaining a high correlation of the description of molecular similarity to well-known molecular fingerprints like ECFP. The resulting software is able to search prominent spaces like EnamineREAL with more than 10 billion compounds in seconds on a standard desktop computer.

摘要

在基于相似性的虚拟筛选中,分子指纹广泛用于评估化学文库中所有化合物与目标化合物的相似性。这种相似性分析通常是针对库中的每个成员分别进行的。当编码的化学空间大小超过数十亿种化合物时,枚举它们的所有产物并评估其相似性变得不切实际,因此,如果不投入大量资源,这种方法是不可能实现的。在这项工作中,我们提出了一种名为 SpaceLight 的新搜索算法,用于在大型、实际上不可枚举的组合片段空间中进行拓扑指纹相似性搜索。与现有方法相比,SpaceLight 能够利用这些化学空间的组合特性来提高效率,同时保持与 ECFP 等知名分子指纹对分子相似性描述的高度相关性。所得到的软件能够在标准台式计算机上几秒钟内搜索像 EnamineREAL 这样的大型空间,其中包含超过 100 亿种化合物。

相似文献

1
Topological Similarity Search in Large Combinatorial Fragment Spaces.拓扑相似性搜索在大型组合碎片空间中。
J Chem Inf Model. 2021 Jan 25;61(1):238-251. doi: 10.1021/acs.jcim.0c00850. Epub 2020 Oct 21.
2
Comparison of Combinatorial Fragment Spaces and Its Application to Ultralarge Make-on-Demand Compound Catalogs.组合片段空间的比较及其在超大型按需合成化合物库中的应用
J Chem Inf Model. 2022 Feb 14;62(3):553-566. doi: 10.1021/acs.jcim.1c01378. Epub 2022 Jan 20.
3
Calculating and Optimizing Physicochemical Property Distributions of Large Combinatorial Fragment Spaces.计算和优化组合碎片空间的物理化学性质分布。
J Chem Inf Model. 2022 Jun 13;62(11):2800-2810. doi: 10.1021/acs.jcim.2c00334. Epub 2022 Jun 2.
4
Efficient exploration of large combinatorial chemistry spaces by monomer-based similarity searching.通过基于单体的相似性搜索对大型组合化学空间进行高效探索。
J Chem Inf Model. 2009 Apr;49(4):745-55. doi: 10.1021/ci800392z.
5
Searching Fragment Spaces with feature trees.使用特征树搜索片段空间。
J Chem Inf Model. 2009 Feb;49(2):270-9. doi: 10.1021/ci800272a.
6
LEAP into the Pfizer Global Virtual Library (PGVL) space: creation of readily synthesizable design ideas automatically.跃入辉瑞全球虚拟图书馆(PGVL)空间:自动生成易于合成的设计理念。
Methods Mol Biol. 2011;685:253-76. doi: 10.1007/978-1-60761-931-4_13.
7
Maximum Common Substructure Searching in Combinatorial Make-on-Demand Compound Spaces.组合按需合成化合物空间中的最大公共子结构搜索。
J Chem Inf Model. 2022 May 9;62(9):2133-2150. doi: 10.1021/acs.jcim.1c00640. Epub 2021 Sep 3.
8
Connected Subgraph Fingerprints: Representing Molecules Using Exhaustive Subgraph Enumeration.连通子图指纹:通过穷举子图枚举来表示分子。
J Chem Inf Model. 2019 Nov 25;59(11):4625-4635. doi: 10.1021/acs.jcim.9b00571. Epub 2019 Oct 25.
9
Similarity searching and scaffold hopping in synthetically accessible combinatorial chemistry spaces.在可合成的组合化学空间中的相似性搜索与骨架跃迁
J Med Chem. 2008 Apr 24;51(8):2468-80. doi: 10.1021/jm0707727. Epub 2008 Apr 2.
10
Chemical Structure Similarity Search for Ligand-based Virtual Screening: Methods and Computational Resources.基于配体的虚拟筛选的化学结构相似性搜索:方法与计算资源
Curr Drug Targets. 2016;17(14):1580-1585. doi: 10.2174/1389450116666151102095555.

引用本文的文献

1
A Benchmark Set of Bioactive Molecules for Diversity Analysis of Compound Libraries and Combinatorial Chemical Spaces.用于化合物库和组合化学空间多样性分析的生物活性分子基准集。
J Chem Inf Model. 2025 Sep 8;65(17):9097-9124. doi: 10.1021/acs.jcim.5c00719. Epub 2025 Aug 20.
2
SAVI Space-combinatorial encoding of the billion-size synthetically accessible virtual inventory.SAVI:十亿规模可合成获取虚拟库的空间组合编码
Sci Data. 2025 Jun 23;12(1):1064. doi: 10.1038/s41597-025-05384-z.
3
CoLiNN: A Tool for Fast Chemical Space Visualization of Combinatorial Libraries Without Enumeration.
CoLiNN:一种无需枚举即可快速可视化组合库化学空间的工具。
Mol Inform. 2025 Mar;44(3):e202400263. doi: 10.1002/minf.202400263.
4
Active learning driven prioritisation of compounds from on-demand libraries targeting the SARS-CoV-2 main protease.主动学习驱动从针对严重急性呼吸综合征冠状病毒2(SARS-CoV-2)主要蛋白酶的按需文库中对化合物进行优先级排序。
Digit Discov. 2025 Jan 8;4(2):438-450. doi: 10.1039/d4dd00343h. eCollection 2025 Feb 12.
5
Utilizing Low-Dimensional Molecular Embeddings for Rapid Chemical Similarity Search.利用低维分子嵌入进行快速化学相似性搜索。
Adv Inf Retr. 2024 Mar;14609:34-49. doi: 10.1007/978-3-031-56060-6_3. Epub 2024 Mar 16.
6
Protein Structure-Based Organic Chemistry-Driven Ligand Design from Ultralarge Chemical Spaces.基于蛋白质结构的有机化学驱动的超大型化学空间配体设计
ACS Cent Sci. 2024 Feb 13;10(3):615-627. doi: 10.1021/acscentsci.3c01521. eCollection 2024 Mar 27.
7
SpaceGrow: efficient shape-based virtual screening of billion-sized combinatorial fragment spaces.SpaceGrow:高效的基于形状的百亿级组合片段空间虚拟筛选。
J Comput Aided Mol Des. 2024 Mar 17;38(1):13. doi: 10.1007/s10822-024-00551-7.
8
Enhanced Calculation of Property Distributions in Chemical Fragment Spaces.增强化学碎片空间中属性分布的计算。
J Chem Inf Model. 2024 Mar 25;64(6):2008-2020. doi: 10.1021/acs.jcim.4c00147. Epub 2024 Mar 11.
9
HIt Discovery using docking ENriched by GEnerative Modeling (HIDDEN GEM): A novel computational workflow for accelerated virtual screening of ultra-large chemical libraries.基于对接增强生成建模的 HIt 发现(HIDDEN GEM):一种用于加速超大规模化学库虚拟筛选的新型计算工作流程。
Mol Inform. 2024 Jan;43(1):e202300207. doi: 10.1002/minf.202300207. Epub 2023 Dec 19.
10
School of cheminformatics in Latin America.拉丁美洲化学信息学学院。
J Cheminform. 2023 Sep 19;15(1):82. doi: 10.1186/s13321-023-00758-0.