MDPI开放科学分享 http://blog.sciencenet.cn/u/mdpi https://www.mdpi.com/

博文

南京信息工程大学余文斌副教授团队:NISQ时代基于变分量子算法的量子卷积长短期记忆

已有 652 次阅读 2025-12-9 19:01 |个人分类:学术软文|系统分类:论文交流

原文作者介绍

徐泽宇

南京信息工程大学。研究方向:量子机器学习/变分量子算法在序列建模中的应用。

        

余文斌

南京信息工程大学。研究方向:量子信息处理、机器学习 (尤其量子‐经典混合模型)。

      

文章导读

经典LSTM虽能捕捉时序数据长期依赖并用于天气预测等领域,但训练成本随数据需求激增,处理复杂场景时存挑战;在量子与机器学习融合背景下,QLSTM虽借量子特性提效却忽略数据空间相关性,且NISQ (Noisy Intermediate-Scale Quantum) 时代噪声突出、现有研究对模型抗噪声关注不足,而变分量子算法因天然抗噪声性具有优势。据此,本文提出QConvLSTM模型,结合经典卷积LSTM与变分量子算法并首次融入QCNN,保留时序建模能力且增强空间特征提取,分层树状电路设计可降低量子资源需求,在Moving-MNIST数据集上性能优于传统模型,对常见非相干噪声鲁棒性强。在理论上完善了量子模型体系,应用上为时空序列建模提供了适配NISQ设备的方案,推动量子机器学习落地。

       

研究材料与方法

该研究处于NISQ时代的量子计算与机器学习交叉领域。传统的时序模型如LSTM在处理大规模、含空间特征的时空数据时,训练成本迅速上升。量子计算 (尤其变分量子算法—VQA) 在噪声中型量子设备上具备天然噪声韧性,因此是结合经典神经网络、提升训练效率与模型性能的新方向。为了兼顾“时序依赖”与“空间特征提取”,本文将经典的卷积-LSTM (ConvLSTM) 结构与量子变分电路 (VQC) 结合,构建了新的模型。

其理论框架采用了ConvLSTM基础,经典ConvLSTM将卷积操作引入LSTM的输入-状态、状态-状态转换,从而同时捕捉空间和时间维度特征;还采用了量子变分电路,由编码层、可参数化量子门 (Variational Layer) 及测量层构成。编码层将经典数据输入变为量子态,变分层通过参数化量子门优化量子态,最后通过测量获得输出;除此之外还采用了QConvLSTM架构,该模型将量子卷积操作插入LSTM的输入-状态转换和状态-状态转换中,使其既具有LSTM的时间建模能力,又具备额外的空间特征抽取能力。

研究还采用了量子卷积电路结构,为了减少量子位数和电路深度、提高并行能力,作者设计了一个层级树形结构 (hierarchical tree-like) 量子卷积电路:从多组两量子比特模块开始,每层逐渐减少量子比特数,直到最后剩余一个量子比特进行平均期望值测量。这种设计的优点包括:减少量子比特需求、降低电路深度、缓解“barren plateau” (平坦梯度) 问题,从而增强训练可行性。

最后,研究考虑了NISQ设备中常见的无相干噪声通道,进行噪声模型与仿真实验,包括:比特翻转、相位翻转、比特-相位翻转,以及去极化噪声。对应的Kraus算子在文中给出。在实验中,他们不仅进行了无噪声模拟,还在每个量子卷积层后加入噪声通道,以检验模型在噪声环境下的鲁棒性。

       

研究结果与讨论

无噪声环境下QConvLSTM性能优于多种对比模型

研究在无噪声模拟场景中,以Moving-MNIST数据集为研究对象,采用幅度编码方式开展实验,并通过MSE、SSIM、LPIPS三项常用指标评估模型性能,各模型帧间结果对比图的可视化呈现与对应数据表格的验证,发现QConvLSTM的综合表现显著优于经典LSTM、ConvLSTM及量子全连接结构的QLSTM。相比之下,QConvLSTM因同时保留LSTM的时序建模能力与量子卷积的空间特征提取能力,在时空序列建模任务中展现出更优的效果,各项性能指标均有明显提升。

     

1 4.png

图为基于训练集训练的模型在Moving-MNIST测试集上的逐帧结果:(a) MSE;(b) SSIM;(c) LPIPS。

        

QConvLSTM对NISQ时代常见噪声具备强鲁棒性

为适配NISQ设备的实际应用场景,研究在量子卷积网络各层添加多种常见非相干噪声通道进行模拟实验。结果显示,即使引入噪声,QConvLSTM的各项性能指标与无噪声环境下差异极小,未出现明显波动。作者分析认为,这种强鲁棒性源于浅电路结构减少了噪声干扰概率、含卷积操作的LSTM单元能充分提取数据特征以适配噪声影响,以及变分量子算法增强了网络对非线性噪声信息的处理能力,这使得QConvLSTM更适用于NISQ时代的实际任务。

         

电路层数与VQC结构显著影响模型性能及效率

在电路层数优化方面,研究测试了不同层数的电路结构,发现层数过少会导致性能较差,层数过多虽性能略有提升,但会使计算与时间复杂度呈指数增长,且更易引入噪声,最终选择平衡性能与效率的层数方案。在VQC结构选择上,研究设计了多种VQC模块结构并进行对比,结果表明不同VQC结构对模型性能影响明显,其中某一特定结构的表现最优。作者指出,需结合具体应用场景设计适配的VQC结构,才能最大化模型效果。

           

2.png

图为VQC的结构设计

        

研究总结

本文主要探讨了在NISQ时代如何利用变分量子算法 (VQA) 构建一种结合卷积与长短期记忆机制的量子神经网络——量子卷积长短期记忆网络 (QCLSTM)。研究的出发点是当前量子硬件仍存在噪声大、量子比特数量有限等问题,作者希望通过量子-经典混合架构,使量子模型在现有设备上具备可行性与优势。

论文提出的QCLSTM模型将经典深度学习中的卷积特征提取与时序信息建模思想迁移至量子域。量子卷积层通过参数化量子电路实现局部特征提取,而量子LSTM单元则利用量子门结构模拟输入门、遗忘门和输出门,以实现对量子态的动态记忆与更新。整个模型采用变分量子算法训练,即利用经典优化器更新量子电路参数,从而在NISQ设备可承受的电路深度和噪声水平下完成学习任务。

实验结果显示,QCLSTM在时间序列预测等任务上能够取得与经典模型相当甚至略优的性能,同时在参数量和计算资源上更为高效。作者指出,该方法验证了量子深度学习在时序建模方面的可行性,为未来更大规模的量子神经网络研究提供了方向。尽管当前仍受限于量子硬件条件,但本研究展示了量子计算在机器学习中的潜在优势与发展前景。

        

阅读英文原文:https://www.mdpi.com/2078-2489/15/4/175

         

Information 期刊介绍

主编:Willy Susilo,  University of Wollongong, Northfields Avenue, Australia

期刊鼓励学者详尽地发表实验与理论研究成果,涵盖信息科学与技术、数据管理、知识系统及通信领域的前沿研究。目前,期刊已被Scopus(Information Systems领域,Q2)、ESCI(Web of Science,Q2)、Ei Compendex、dblp等数据库收录。

2024 Impact Factor:2.9

2024 CiteScore:6.5

Time to First Decision:18.6 Days

Acceptance to Publication:3.6 Days

尾图1.jpg

尾图2.jpg



https://blog.sciencenet.cn/blog-3516770-1513633.html

上一篇:Methods and Protocols期刊编委招募公告——邀您共同促进学术期刊发展
下一篇:Agriculture:从配子到妊娠——提高家畜繁殖效率的新策略
收藏 IP: 61.242.144.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-11 04:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部