LIU C X, LIU B H, ZHANG X, et al. Intelligent service oriented fog radio access network:principles, technologies and challenges[J]. Chinese Journal of Intelligent Science and Technology, 2021, 3(1): 10-17.
1.引言
人工智能(artificial intelligence,AI)在语音/图像识别、自然语言处理以及推荐/搜索引擎等领域取得了突破性进展,并由此衍生了包括无人驾驶、增强现实(augmented reality,AR)、虚拟现实(virtual reality,VR)、智能写作、智能物联网、数字卫生系统、智能搜索引擎以及个性化推送等在内的一系列智能服务。随之产生的大量数据和庞大的终端接入设备可能会在安全、隐私、服务供应和网络管理等方面带来挑战。 智能服务按照通信需求可以分为以下3类:海量机器通信(massive machine type communication, mMTC)业务、增强型移动宽带(enhanced mobile broadband,eMBB)业务以及与低时延高可靠通信(ultra reliable and low latency communication, uRLLC)业务,人工智能与通信需求的结合如图1所示。其中,以智慧城市、环境监测以及智慧农业为代表的 mMTC 业务,要求设备密度达到每平方千米数百万个,相较于传统的上一代移动通信,设备密度提升了 10~100 倍。以 VR/AR、高清视频以及全息投影为代表的eMBB业务要求为用户提供1 Gbit/s的传输速率、数十Gbit/s的峰值速率和每平方千米数十Tbit/s的流量密度。以自动驾驶、智能工厂以及远程控制等智能服务为主的 uRLLC 业务,要求空口时延达到1 ms、端到端时延达到数十毫秒级,可靠性接近100%。
为了满足这些智能服务的需求,保证用户体验,需要将AI技术与大数据结合,共同实现网络的智能化。其中,边缘智能化是网络智能化的一个重要组成部分,边缘智能化可以有效解决过载和用户隐私安全等问题。然而,当前关于网络智能化的研究主要考虑集中式的网络架构,例如云无线接入网(cloud radio access network,C-RAN)架构将全部的计算和处理能力集中于中央云,中央云基于全局信息进行数据的处理并做出相应决策。这种集中式的网络架构在实现网络智能化时存在如下问题。一是难以进行数据的有效管理,未来进入物联网时代,数据源更加复杂多样,会具有稀疏性、异构性、移动性以及波动性等特征,传统的基于云计算的处理模式难以有效处理这些海量数据;二是时延较长,服务时延是影响用户服务质量(quality of service,QoS)的重要因素,尽管云计算庞大的处理能力能够有效缩短处理时延,但是考虑到用户位于网络边缘的场景,传输时延仍然过长;三是用户隐私保护受到威胁。为解决上述问题,本文引入雾无线接入网络(fog radio access network,F-RAN)架构。雾无线接入网络架构是一种分布式网络架构,通过充分利用网络边缘节点的无线信号处理、协作无线资源管理以及分布式缓存计算等能力,实现网络边缘按需处理和业务分发,减轻回传链路以及中央云的负担,实现灵活自适应的网络管理。因此,可以将人工智能技术与雾无线接入网络结合,在满足智能服务需求的同时,更加安全、智能、高效地进行网络运营与管理。
2.AI驱动的雾无线接入网络
本节从基于人工智能的雾无线接入网络(artificial intelligence-based fog radio access network,AI-FRAN)的网络架构、理论和性能几个方面,来阐述AI驱动的雾无线接入网络。
2.1 AI-FRAN的网络架构
智能服务对巨容量、极低时延、超高可靠和海量链接,以及网络的动态可重构特性和智能化水平,提出了更高的要求。当前 5G 网络依旧难以满足上述需求,需要进一步增强,并在无线网络技术和服务提供等方面产生颠覆性的技术革新。传统F-RAN的网络架构虽然在降低时延、提升网络容量和改善用户QoS等方面表现出了较大潜力,但也存在如下缺陷:一是网络节点类型、协议分割方式以及节点服务能力之间的异构性,使得 F-RAN 在复杂的环境下难以实现智能化协同,网络性能受限;二是网络资源维度增加,资源之间的空间、时间尺度存在差异并相互耦合,使得多维度多目标跨场景的资源调配十分复杂,并且难以保证性能需求;三是网络规划优化和运维参数剧增,传统的结构单一的集中式或分布式的网络规划优化方案难以满足未来网络对性能进行智能监测、故障预警和提前自主优化的需求,同时网络运营维护成本高、难度大。因此,为了应对网络异构性、多维资源调配等带来的未来网络协同难度大的挑战,同时降低网络管理和运维成本,急需提升网络智能化水平,以满足未来智能服务的需求。 AI-FRAN 的网络架构的核心思想是充分利用F-RAN的架构优势和AI基于大数据驱动的认知、学习、推理的智能特性,在传统 F-RAN 的网络架构的基础上,借助AI方法参与组网,提升网络智能化水平,特别是网络边缘的智能化能力,以满足智能服务的差异化需求。AI-FRAN的网络架构如图2所示,除了由 F-RAN 中的各类节点(包括高功率节点(high power node,HPN)、射频拉远头(remote radio head,RRH)、雾接入节点(fog access point, F-AP),以及基带单元池(baseband unit pool,BBU pool))组成外,同时在 HPN 和 F-AP 中部署了本地 AI 引擎,在 BBU pool 和核心网中部署了全局AI引擎。RRH通过前传链路(fronthaul)与基带单元池连接,实现集中式通信、缓存和计算功能;F-AP不仅具备无线信号处理能力,还具备边缘缓存、计算及资源管理能力。F-AP 通过回程链路(backhaul)与核心网相连。HPN通过回程链路与核心网相连,HPN可以由传统的宏基站配置一定的边缘计算能力来实现,HPN除了提供广域覆盖和对低速移动用户的支持外,还负责网络控制面信令的分发。
AI-FRAN的网络架构的显著特征在于通过在BBU pool、HPN 和 F-AP,甚至是在各类雾终端节点上部署 AI 算法和功能,借助网络各层级数据采集处理、建模、线下/线上训练与分析决策,提升环境、终端、网络、服务的智能感知能力,增强网络适配能力,真正实现网络中多维资源的动态协同。 具体地,全局AI引擎主要负责收集网络中的全局信息,包括网络中的业务属性信息(业务种类、性能指标需求、对应业务的负载等)、网络故障预警监测信息,以及F-AP、终端上报的测量信息等。部署在HPN中的本地AI引擎主要负责对全局AI引擎下沉部分进行控制和决策,以降低控制面时延和决策时延,为广域覆盖和大链接场景下的智能业务提供支撑。部署在F-AP上的本地AI引擎主要负责为uRLLC业务提供本地控制以及执行其对应的AI算法。随着智能终端的计算能力和存储能力不断增强,AI-FRAN 的智能终端节点也具有了一定的 AI 能力,包括基础的数据收集、预处理和模型训练,甚至简单的基于 AI 模型的决策能力。
通过在 F-RAN 中部署集中式和分布式自适应的 AI 算法,面向不同的业务需求,在不同空间、时间和资源维度进行智能化数据采集、模型训练和决策,可以更有针对性地提升网络性能,同时可以维持较低的AI算法设计和部署的复杂度,从而为包括超高清视频、AR/VR、智能车联网、工业物联网等在内的广泛智能服务提供支撑。
2.2 AI-FRAN理论
本节将从 AI-FRAN 组网基本原理,AI-FRAN的信号处理、资源调配和网络管理,以及面向智能服务的 AI-FRAN 层间协同 3 个方面来阐述AI-FRAN理论。首先,AI-RAN组网基本原理主要概述了AI与F-RAN结合的必要性和优势。然后,从 AI 在无线网络中应用的角度,依次介绍了AI-FRAN的信号处理、资源调配和网络管理,阐述AI如何与F-RAN结合以提升网络智能化水平。最后,为了实现AI与F-RAN的深度融合,满足智能服务苛刻的性能需求,根据未来智能服务的特征,重点阐述了AI-FRAN的核心特征——AI-FRAN层间协同在 AI 算法部署、训练和智能决策中如何提供柔性可重构的网络架构保障。
2.2.1 AI-FRAN组网基本原理
F-RAN充分利用网络边缘分布式的存储和计算能力,为网络边缘智能化提供了计算能力,这是传统蜂窝网络不具备的优势。F-RAN为数据采集、本地处理、传输以及根据智能服务的性能需求借助 AI 技术进行训练和决策等提供架构优势和性能保障。比如,通过将全局AI引擎的部分功能下沉到F-AP中的本地AI引擎中进行部署,一方面可以降低数据采集和传输过程对回程链路的负载,另一方面可以降低部署完成后的AI算法感知、响应和决策等整个过程的时延,从而提升网络效率和用户服务质量。 从网络架构的角度来看,集中式网络架构下的AI功能部署存在一些突出问题:一方面,通信成本过高,大量的数据采集、反馈和传输占用了大量的通信资源;另一方面,数据需要被集中收集和训练,在数据采集、传输、反馈等过程中存在数据安全、终端用户隐私泄露的问题。而 F-RAN 结合分布式智能学习技术(如联邦学习)能较好地解决该问题。同时 AI 技术本身具有较强的可扩展性、可迁移性以及对网络环境和样本数据的泛化能力,特别是通过线上数据采集、线下数据分析训练,然后迁移部署,可以降低AI功能的部署成本和缩短维护周期。此外,借助轻量级的线上训练模型,AI算法可以被在线更新,从而提升 AI 功能对环境的适配能力,当AI技术和F-RAN结合后,AI-FRAN能够在满足较低复杂度要求的同时,保持较高的网络弹性和智能化水平。 因此AI-FRAN组网方案将充分发挥F-RAN的架构优势和 AI 技术智能化,可扩展可迁移,在线实时训练、更新、决策等显著优势,为智能服务提供更高的性能保障和网络效率。 2.2.2 AI-FRAN的信号处理、资源调配和网络管理信号处理、资源调配和网络管理是网络系统设计的3个重要方面,AI在其中的应用已受到广泛关注,本文将重点从这3个方面阐述AI与F-RAN 如何结合,以提升F-RAN的智能化水平。 (1)AI-FRAN的信号处理AI-FRAN的信号处理主要包括基于AI和大数据的无线信号检测、无线信道估计、无线信号的解调解码等。AI-FRAN的信号处理的核心思想是利用基础 AI 和大数据分析技术,收集时间、空间、频率等维度的无线大数据,基于深度神经网络模型来自主分析和提取信道特征,进行信道的辅助建模、信号检测和信道估计等。以信道估计为例,通过人工智能的方法来实现传统通信系统中的信道估计算法,可以在信道先验信息未知的情况下,只通过少量的参考信号(甚至不需要参考信号),就能够较准确地估计当前信道。 (2)AI-FRAN的资源调配AI-FRAN的资源调配主要包括基于AI算法的多用户调度、单维度资源管理和多维度资源的联合分配等。为了满足未来差异化的智能业务需求,除了需要充分利用AI-FRAN的多种接入方式、传输方式和灵活的网络架构,还需要充分考虑资源的调配以及资源本身的特性(包括时间尺度属性、资源之间的耦合特性等),利用人工智能方法建立不同的智能业务模型,用于感知、预测不同业务对的性能需求,实现通信、存储、计算资源的协同编排调度,实现多性能指标的联合优化,以满足目标智能业务的性能需求。 (3)AI-FRAN的网络管理AI-FRAN 的网络管理主要包括基于 AI 技术的F-RAN网络规划优化和运维等。无线大数据分析和人工智能方法是实现未来智慧移动通信网络的重要方法。随着移动网络越来越复杂,网络参数剧增,网络规划优化和运维成本占据着运营商成本的很大比例。考虑到 AI-FRAN 在网络架构上的灵活性,单一集中式或分布式的网络管理架构将很难满足网络管理对网络性能自主优化、网络故障预警、网络故障自动治愈的性能需求。通过全局AI引擎和本地AI引擎的协作,按照时间尺度信息、网络覆盖范围和网络状态信息属性进行分层收集和训练,一方面能降低网络数据隐私泄露的风险,另一方面能降低网络数据传输负载和单点故障造成的影响。
2.2.3 面向智能服务的AI-FRAN层间协同
随着智能服务的不断涌现,不同的智能服务在传输速率、时延、可靠性、连接数等方面存在较大差异,这对 AI-FRAN 的网络架构提出了柔性可重构的要求。从智能业务需求的角度来看,通过AI-FRAN层间协同,可以实现AI-FRAN的网络功能动态适配业务的需求。 针对巨容量智能业务,例如热点地区超高清视频业务,AI-FRAN的全局AI引擎通过终端感知和业务感知,将基于雾计算的用户设备(fog computing based-user equipment,F-UE)智能终端调配给多个RRH协作服务,以提供高速率。在这个过程中,智能终端根据网络需求采集的数据可以在本地进行模型训练,然后将模型参数上传给全局 AI 引擎;智能终端也可以直接将采集的数据上传到 AI 全局控制器进行全局模型的训练。 针对高速率且低时延的智能服务,例如VR/AR,模型的训练和决策可以在F-AP中的本地 AI 引擎中进行,也可以根据时延需求的严苛程度,将部分决策集中在全局AI引擎中执行。 针对超低时延高可靠智能业务,例如智能车联网业务,AI-FRAN的全局AI引擎通过终端感知和业务感知,将车联网智能终端调配给 F-AP 进行服务,考虑到车联网智能终端的移动性,可以由多个F-AP组成雾计算簇,通过F-AP之间的协作保证低时延和高可靠的性能需求。 针对海量连接智能业务,例如工业物联网业务,上行数据可以先在本地簇头节点上进行汇聚处理,包括数据的压缩、基础模型的训练等操作。考虑到工业物联网大链接场景对时延的要求,可以在HPN中的本地AI引擎或全局AI引擎中进行模型的训练和决策。
2.3 AI-FRAN的性能研究
传统F-RAN的性能指标主要包括能量效率、频谱效率、时延、吞吐量、能耗等,这些指标是传统网络的常用性能指标,维度较为单一,侧重某一方面的性能,缺少对网络整体性能的刻画。当AI与FRAN结合后,网络将更加注重感知能力以及对大数据的采集、分析、训练和推理决策。因此,AI-FRAN 需要在关注多维度性能指标、网络整体性能的同时,关注 AI 本身以及 AI 与FRAN 结合带来的新的综合性能指标,例如AI-FRAN 性能的确定性、可预测性、感知灵敏性甚至复杂性等。 当前对 AI 方法的性能的可解释性研究还处于初始阶段,无法直接通过理论分析给出普遍的性能规律,因此需要考虑基于仿真和半定性的性能分析方法,借助现有的确定性结论,例如性能上下限、算法的收敛性等理论基础,再通过大量的仿真来模拟网络环境,通过仿真实验来获取统计性能结果,并初步探究影响性能的因素,然后基于该试验结果来设计新的性能分析方法。AI-FRAN的性能分析可以考虑使用类似的方法。然而,当前的研究多集中在借助AI方法来解决传统的优化问题[4,5],例如用户接入方式选择、无线资源分配、缓存方案、计算资源分配等问题,没有将AI与F-RAN深度融合,对 AI-FRAN 本身的理论性能的分析研究还十分欠缺。对AI-FRAN网络系统层级的性能研究有待进一步深入,可以考虑在传统随机几何理论分析方法的基础上,提出引入AI后的新的性能量化分析方法。
随着下一代移动通信和人工智能等技术的发展,mMTC、eMBB以及uRLLC等具有不同性能需求的应用场景对未来的通信网络的多维资源多目标差异优化提出了新的挑战。考虑到对通信、计算以及缓存等资源的分配在时间尺度和空间尺度上存在较大差异,并且3种资源难以解耦合等问题,针对跨场景跨业务的 AI-FRAN 需要根据其不同的性能需求(例如高容量、低时延、高可靠、大连接等),对通信、计算和缓存资源进行多维资源多目标差异优化,构建基于 AI 的智能资源调配模型,对整体参数进行系统化的智能训练,在解决多维资源耦合以及其时空差异特性等问题的同时,实现对不同业务的多目标优化。
传统基于随机几何的网络性能分析方法具有很强的可解释性,相比于F-RAN,面向智能服务的AI-FRAN借助AI技术将带来性能增益,但大数据驱动的 AI 方法本身性能的可解释性还很缺乏,这将导致 AI-FRAN 的系统层级的性能分析难度大且难以解释性能成因规律。因此,需要从 AI 方法本身着手,针对 AI-FRAN 的网络性能分析提出新的性能可解释分析方法。