• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 Neumann-Cayley 正交门控循环单元的新型分子表示。

Novel Molecular Representations Using Neumann-Cayley Orthogonal Gated Recurrent Unit.

机构信息

Department of Mathematics, University of Kentucky, Lexington, Kentucky 40506, United States.

出版信息

J Chem Inf Model. 2023 May 8;63(9):2656-2666. doi: 10.1021/acs.jcim.2c01526. Epub 2023 Apr 19.

DOI:10.1021/acs.jcim.2c01526
PMID:37075324
Abstract

Advances in deep neural networks (DNNs) have made a very powerful machine learning method available to researchers across many fields of study, including the biomedical and cheminformatics communities, where DNNs help to improve tasks such as protein performance, molecular design, drug discovery, etc. Many of those tasks rely on molecular descriptors for representing molecular characteristics in cheminformatics. Despite significant efforts and the introduction of numerous methods that derive molecular descriptors, the quantitative prediction of molecular properties remains challenging. One widely used method of encoding molecule features into bit strings is the molecular fingerprint. In this work, we propose using new Neumann-Cayley Gated Recurrent Units (NC-GRU) inside the Neural Nets encoder (AutoEncoder) to create neural molecular fingerprints (NC-GRU fingerprints). The NC-GRU AutoEncoder introduces orthogonal weights into widely used GRU architecture, resulting in faster, more stable training, and more reliable molecular fingerprints. Integrating novel NC-GRU fingerprints and Multi-Task DNN schematics improves the performance of various molecular-related tasks such as toxicity, partition coefficient, lipophilicity, and solvation-free energy, producing state-of-the-art results on several benchmarks.

摘要

深度学习神经网络 (DNN) 的发展为许多研究领域的研究人员提供了一种非常强大的机器学习方法,包括生物医学和化学信息学领域,在这些领域,DNN 有助于提高蛋白质性能、分子设计、药物发现等任务的效率。许多这些任务都依赖于分子描述符来表示化学信息学中的分子特征。尽管已经做出了巨大的努力并引入了许多衍生分子描述符的方法,但定量预测分子性质仍然具有挑战性。一种将分子特征编码为位字符串的常用方法是分子指纹。在这项工作中,我们建议在神经网络编码器 (AutoEncoder) 中使用新的诺伊曼-凯莱门控循环单元 (NC-GRU) 来创建神经分子指纹 (NC-GRU 指纹)。NC-GRU AutoEncoder 将正交权重引入到广泛使用的 GRU 架构中,从而实现更快、更稳定的训练和更可靠的分子指纹。整合新颖的 NC-GRU 指纹和多任务 DNN 原理图可提高毒性、分配系数、亲脂性和溶剂自由能等各种与分子相关的任务的性能,在几个基准测试中取得了最先进的结果。

相似文献

1
Novel Molecular Representations Using Neumann-Cayley Orthogonal Gated Recurrent Unit.使用 Neumann-Cayley 正交门控循环单元的新型分子表示。
J Chem Inf Model. 2023 May 8;63(9):2656-2666. doi: 10.1021/acs.jcim.2c01526. Epub 2023 Apr 19.
2
Orthogonal Gated Recurrent Unit With Neumann-Cayley Transformation.具有诺伊曼 - 凯莱变换的正交门控循环单元
Neural Comput. 2024 Nov 19;36(12):2651-2676. doi: 10.1162/neco_a_01710.
3
A novel molecular representation with BiGRU neural networks for learning atom.用于学习原子的 BiGRU 神经网络的新型分子表示。
Brief Bioinform. 2020 Dec 1;21(6):2099-2111. doi: 10.1093/bib/bbz125.
4
Fertility-GRU: Identifying Fertility-Related Proteins by Incorporating Deep-Gated Recurrent Units and Original Position-Specific Scoring Matrix Profiles.Fertility-GRU:通过整合深度门控循环单元和原始位置特定评分矩阵谱来识别与生育力相关的蛋白质。
J Proteome Res. 2019 Sep 6;18(9):3503-3511. doi: 10.1021/acs.jproteome.9b00411. Epub 2019 Aug 7.
5
Generative machine learning for de novo drug discovery: A systematic review.生成式机器学习在从头药物发现中的应用:系统评价。
Comput Biol Med. 2022 Jun;145:105403. doi: 10.1016/j.compbiomed.2022.105403. Epub 2022 Mar 13.
6
ET-GRU: using multi-layer gated recurrent units to identify electron transport proteins.ET-GRU:利用多层门控循环单元识别电子传输蛋白。
BMC Bioinformatics. 2019 Jul 6;20(1):377. doi: 10.1186/s12859-019-2972-5.
7
Improving Molecular Contrastive Learning via Faulty Negative Mitigation and Decomposed Fragment Contrast.通过错误负样本缓解和分解片段对比来提升分子对比学习。
J Chem Inf Model. 2022 Jun 13;62(11):2713-2725. doi: 10.1021/acs.jcim.2c00495. Epub 2022 May 31.
8
A data-driven hybrid ensemble AI model for COVID-19 infection forecast using multiple neural networks and reinforced learning.基于多神经网络和强化学习的 COVID-19 感染预测数据驱动混合集成人工智能模型。
Comput Biol Med. 2022 Jul;146:105560. doi: 10.1016/j.compbiomed.2022.105560. Epub 2022 Apr 27.
9
Representing Polymers as Periodic Graphs with Learned Descriptors for Accurate Polymer Property Predictions.将聚合物表示为具有学习描述符的周期性图,以实现准确的聚合物性质预测。
J Chem Inf Model. 2022 Nov 28;62(22):5435-5445. doi: 10.1021/acs.jcim.2c00875. Epub 2022 Oct 31.
10
TOP: A deep mixture representation learning method for boosting molecular toxicity prediction.标题:一种用于提升分子毒性预测的深度混合表示学习方法。
Methods. 2020 Jul 1;179:55-64. doi: 10.1016/j.ymeth.2020.05.013. Epub 2020 May 21.

引用本文的文献

1
Advancing Drug Discovery with Enhanced Chemical Understanding via Asymmetric Contrastive Multimodal Learning.通过不对称对比多模态学习增强化学理解以推进药物发现
J Chem Inf Model. 2025 Jul 14;65(13):6547-6557. doi: 10.1021/acs.jcim.5c00430. Epub 2025 Jun 23.