博文

《中国激光》2020年第5期亮点文章(四)：—光子神经网络

已有 4620 次阅读 2020-7-15 17:18 |系统分类:论文交流

光子神经网络——点亮智能光子

陈宏伟

《中国激光》于2020年第5期出版“纪念激光器诞生60周年”专题。《中国激光》编委、清华大学陈宏伟教授受邀联合北京邮电大学徐坤教授课题组撰写《光子神经网络发展与挑战》，本文回顾了光子神经网络的发展，阐述目前已取得的阶段性进展，并揭示未来的发展趋势和面临的挑战。

背景介绍

（图片来源于网络）

近年来，以神经网络为代表的人工智能技术快速发展。2017年，采用了神经网络的AlphaGo依次战胜了人类顶尖围棋选手李世石和柯洁，展现了人工智能强大的学习和计算能力，揭开了新一代人工智能的序幕。人工智能技术正向着高速低功耗的方向快速发展。

受限于电子器件的固有极限，传统电子神经网络难以进一步提高功率效率与计算速度。而光子神经网络，作为光电子技术与人工智能技术的交叉产物，能够充分发挥光(电)子技术在带宽、容量、速度方面的优势，成为突破传统限制的潜在手段。

当前，光子神经网络技术的研究主要涉及前馈神经网络、循环神经网络（存储池计算）以及脉冲神经网络这三种典型结构。与此同时，光子神经网络也正朝着可实时训练、规模化以及特殊应用等方向继续发展。

研究现状

1. 前馈神经网络

前馈神经网络的计算信息呈现为输入层至输出层的单向流动。

2017年，来自MIT的Shen等人成功构建出世界首款基于集成光子干涉计算单元的前馈神经网络。利用由MZI网络构成的光子干涉计算单元(OIU)，辅以非线性激活模块（图1），该课题组成功实现元音识别功能。据分析，相比于传统电子前馈网络，其结构更能适应高速、低功耗和低延时的运算场景。

2018年，Bagherian等在上述光子干涉计算单元芯片的基础上提出，通过时分复用的方式，利用该芯片分段计算图像卷积，从而构建更加复杂的卷积神经网络结构。该结构模型可用于彩色数字的识别。

图1集成光子干涉计算单元结构和元音识别混淆矩阵。(a)集成光子干涉计算单元结构；(b)元音识别混淆矩阵

2. 循环神经网络(存储池计算)

相异于前馈神经网络，循环神经网络(存储池计算）的计算信息除了前向流动外，还存在同层节点间的流动以及后向反馈流动。

一般循环神经网络由输入层、中间层和输出层组成。训练时，往往只训练输出权重使网络收敛。使用光电子器件构建循环神经网络时，存在串行与并行两种方案。

并行的优势是直观性强，计算速度快。 2011年，Vandoorne等提出的基于半导体光放大器(SOA)的循环神经网络结构以及2016年Bueno等提出的基于空间光学器件的循环神经网络结构均采用该方案。

然而并行存在鲁棒性较差、规模不易扩展以及成本较高等问题，串行方案可改善这些问题。2012年，Paquot等利用光电混合系统率先构建了光电混合串行循环神经网络，实现了信号分类的功能。

3. 脉冲神经网络

脉冲神经网络(SNNs)模拟的神经元更接近生物神经元模型，因此又被称为第三代人工神经网络。脉冲神经元并非在每一次迭代传播中都被激活，而是只有当其膜电位达到阈值时才被激活。

2016年，普林斯顿大学的Prucnal小组提出了基于可激活的石墨烯光纤激光器的脉冲处理系统，其结构如图2所示。该系统主要由掺铒光纤 (增益部分)和石墨烯饱和吸收体(损耗部分)构成，1480 nm激光器携带脉冲刺激信号激发系统产生类LIF (leaky integrate-and-fire)脉冲神经元的响应。该小组于2018年还提出了基于分布式反馈(DFB)激光器结构的神经拟态光子集成电路（图3），并探讨了构建可编程可级联光子神经网络的可行方案。

图2 可激活的石墨烯光纤激光器系统

图3 集成光子神经元

发展趋势

1. 实时训练算法

由于光子本身难以存储，故在电神经网络训练中应用广泛的后向传播算法难以移植于光子神经网络的训练上。针对这一问题，Hughes等人于2018年首次提出了针对集成光子干涉单元的实时训练算法。该算法通过记录光场分布以及移相器的相位分布能够得到向收敛方向下降的梯度值，进而计算下一轮迭代中芯片移相器的相位配置，从而使得芯片整体性能能够逐步收敛。

除此之外，北京邮电大学Zhang等人于2019年提出了基于遗传算法/粒子群算法的非梯度片上训练方案，以减少获取与计算梯度值所带来的器件性能和要求。Zhang等通过仿真分别实现了光神经网络在Iris 数据集、Wine数据集上的在线训练，训练的收敛效果如图4所示。

图4 (a)采用GA算法训练光神经网络的分类效果; (b)采用PSO算法训练光神经网络的分类效果

相比于电子器件，光电子器件实现非线性函数困难，且所实现的非线性函数存在很多非理想特性，因此非线性运算已成为光子神经网络发展的另一个障碍。

1967年，Seldon等提出了在光子神经网络中实现非线性运算的饱和吸收体模型或电子模块，但该方法难于精准控制，且需要将光信号通过光电二极管转化为电信号，从而降低了计算速度。

2019年，Williamson等提出了一种光电混合的非线性运算模块（图5）。该模块除了能够较为精准的产生非线性激活函数，通过改变移相器的相位，还能够实现不同激活函数的转换。同年，Feldmann 等提出了光控相变存储器(PCM)方案，该方案利用相变材料对不同输入光强的透光性差异，进而实现非线性激活函数的功能（图6）。

除此之外，二维石墨烯材料也有望用以实现光学激活函数。

图5 光电混合非线性模块结构以及通过调谐相位实现不同的非线性函数

图6 光控PCM的归一化传输系数曲线

2. 网络规模扩展

光子神经网络的规模化是另一个难解决的问题。一方面，大规模神经网络有利于实现更加复杂的功能，但光子器件的不稳定和难以精细调谐的特性又使得神经网络规模的扩展变得困难。

2018年Lin等提出了一种基于衍射的光子深度神经网络(D2 NN)，能够有效解决这一问题（图7）。利用光衍射叠加,该结构能够实现相邻两层神经元之间的连接，通过改变处于不同位置的像素块厚度来调节所经过光的相位差，从而使得不同节点之间有不同的权值。最后，利用放置于特定位置的PD获得深度神经网络的输出。采用该结构的神经网络每层节点数可以扩充至几百。

除此之外，清华大学陈宏伟课题组提出了一种基于时域拉伸的串行光子神经网络(TS-NN)，利用光纤色散傅里叶变换实现线性矩阵运算，该方法通过并行变串行的方案实现了光电混合的全连接神经网络规模扩展（图8）。

图7 基于衍射的光子深度神经网络结构图

图8 基于时域拉伸的全连接光电神经网络结构

3. 应用场景扩展

一直以来，受限于现有光子神经网络的规模与复杂度，光子神经网络的应用场景十分有限。

2012年，Paquot等成功构建了基于光纤系统的光电混合循环神经网络，可实现通信信道的均衡，是光子神经网络在通信领域的场景扩展。

2019年，清华大学和北京邮电大学Yu等利用光电混合网络构建了二值光相干接收机（图9），实现了对发送端调制信号的恢复。正交相移键控(QPSK)调制的光信号从先通过广播层进入输入层，然后通过二值全光神经网络进行处理，再通过光电二极管和模数转换器变为电信号，最后利用电人工神经网络恢复原始调制信号。该结构可以缓解电域的信号处理压力，降低光接收机整体的功耗，提升光接收机的信号处理速度。此外，该结构还能极大地降低对模数转换器量化位数的要求，从而有效降低光接收机的成本。