• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种加速 Q 学习的经典-量子混合方法。

A hybrid classical-quantum approach to speed-up Q-learning.

机构信息

Dipartimento di Fisica, Università della Calabria, 87036, Arcavacata di Rende, (CS), Italy.

Institute for Cross-Disciplinary Physics and Complex Systems (IFISC) UIB-CSIC, Campus Universitat Illes Balears, 07122, Palma de Mallorca, Spain.

出版信息

Sci Rep. 2023 Mar 8;13(1):3913. doi: 10.1038/s41598-023-30990-5.

DOI:10.1038/s41598-023-30990-5
PMID:36890198
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9995512/
Abstract

We introduce a classical-quantum hybrid approach to computation, allowing for a quadratic performance improvement in the decision process of a learning agent. Using the paradigm of quantum accelerators, we introduce a routine that runs on a quantum computer, which allows for the encoding of probability distributions. This quantum routine is then employed, in a reinforcement learning set-up, to encode the distributions that drive action choices. Our routine is well-suited in the case of a large, although finite, number of actions and can be employed in any scenario where a probability distribution with a large support is needed. We describe the routine and assess its performance in terms of computational complexity, needed quantum resource, and accuracy. Finally, we design an algorithm showing how to exploit it in the context of Q-learning.

摘要

我们引入了一种经典-量子混合计算方法,使得学习代理的决策过程中的性能提高了两倍。利用量子加速器的范例,我们引入了一种在量子计算机上运行的例程,该例程允许概率分布的编码。然后,在强化学习设置中,我们使用此量子例程来编码驱动动作选择的分布。在动作数量虽然有限但很大的情况下,我们的例程非常适用,并且可以在需要具有很大支持的概率分布的任何情况下使用。我们描述了例程,并根据计算复杂性、所需的量子资源和准确性来评估其性能。最后,我们设计了一种算法,展示了如何在 Q-learning 的上下文中利用它。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6ec1/9995512/982dfae8c83e/41598_2023_30990_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6ec1/9995512/2e5a5f0c284d/41598_2023_30990_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6ec1/9995512/982dfae8c83e/41598_2023_30990_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6ec1/9995512/2e5a5f0c284d/41598_2023_30990_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6ec1/9995512/982dfae8c83e/41598_2023_30990_Fig2_HTML.jpg

相似文献

1
A hybrid classical-quantum approach to speed-up Q-learning.一种加速 Q 学习的经典-量子混合方法。
Sci Rep. 2023 Mar 8;13(1):3913. doi: 10.1038/s41598-023-30990-5.
2
Multi-Objective Evolutionary Architecture Search for Parameterized Quantum Circuits.用于参数化量子电路的多目标进化架构搜索
Entropy (Basel). 2023 Jan 3;25(1):93. doi: 10.3390/e25010093.
3
Experimental quantum speed-up in reinforcement learning agents.实验性量子强化学习代理中的速度提升。
Nature. 2021 Mar;591(7849):229-233. doi: 10.1038/s41586-021-03242-7. Epub 2021 Mar 10.
4
Quantum Imitation Learning.量子模仿学习
IEEE Trans Neural Netw Learn Syst. 2024 Oct;35(10):14190-14204. doi: 10.1109/TNNLS.2023.3275075. Epub 2024 Oct 7.
5
Quantum-accessible reinforcement learning beyond strictly epochal environments.超越严格阶段性环境的量子可及强化学习。
Quantum Mach Intell. 2021;3(2):22. doi: 10.1007/s42484-021-00049-7. Epub 2021 Aug 2.
6
Scaling Up Q-Learning via Exploiting State-Action Equivalence.通过利用状态-动作等价性扩展Q学习
Entropy (Basel). 2023 Mar 29;25(4):584. doi: 10.3390/e25040584.
7
Quantum reinforcement learning.量子强化学习
IEEE Trans Syst Man Cybern B Cybern. 2008 Oct;38(5):1207-20. doi: 10.1109/TSMCB.2008.925743.
8
A Quantum Hybrid PSO Combined with Fuzzy k-NN Approach to Feature Selection and Cell Classification in Cervical Cancer Detection.量子混合粒子群算法与模糊 k-最近邻方法在宫颈癌检测中的特征选择和细胞分类。
Sensors (Basel). 2017 Dec 19;17(12):2935. doi: 10.3390/s17122935.
9
Hybrid classical-quantum machine learning based on dissipative two-qubit channels.基于耗散双量子比特通道的混合经典-量子机器学习
Sci Rep. 2022 Nov 28;12(1):20440. doi: 10.1038/s41598-022-24346-8.
10
Quantum Simulation Logic, Oracles, and the Quantum Advantage.量子模拟逻辑、预言机与量子优势
Entropy (Basel). 2019 Aug 15;21(8):800. doi: 10.3390/e21080800.

本文引用的文献

1
Experimental quantum speed-up in reinforcement learning agents.实验性量子强化学习代理中的速度提升。
Nature. 2021 Mar;591(7849):229-233. doi: 10.1038/s41586-021-03242-7. Epub 2021 Mar 10.
2
Quantum reinforcement learning during human decision-making.人类决策过程中的量子强化学习。
Nat Hum Behav. 2020 Mar;4(3):294-307. doi: 10.1038/s41562-019-0804-2. Epub 2020 Jan 20.
3
Quantum machine learning.量子机器学习。
Nature. 2017 Sep 13;549(7671):195-202. doi: 10.1038/nature23474.
4
Quantum Error Correction Protects Quantum Search Algorithms Against Decoherence.量子纠错保护量子搜索算法免受退相干影响。
Sci Rep. 2016 Dec 7;6:38095. doi: 10.1038/srep38095.
5
Quantum-Enhanced Machine Learning.量子增强机器学习
Phys Rev Lett. 2016 Sep 23;117(13):130501. doi: 10.1103/PhysRevLett.117.130501. Epub 2016 Sep 20.
6
Quantum reinforcement learning.量子强化学习
IEEE Trans Syst Man Cybern B Cybern. 2008 Oct;38(5):1207-20. doi: 10.1109/TSMCB.2008.925743.
7
Error Correcting Codes in Quantum Theory.量子理论中的纠错码。
Phys Rev Lett. 1996 Jul 29;77(5):793-797. doi: 10.1103/PhysRevLett.77.793.