|
现有的有轨电车信号优先控制系统存在诸多问题, 如无法适应实时交通变化、优化求解较为复杂等. 本文提出了一种基于深度强化学习的有轨电车信号优先控制策略. 不依赖于交叉口复杂交通建模, 采用实时交通信息作为输入, 在有轨电车整个通行过程中连续动态调整交通信号. 协同考虑有轨电车与社会车辆的通行需求, 在尽量保证有轨电车无需停车的同时, 降低社会车辆的通行延误. 采用深度Q网络算法进行问题求解, 并利用竞争架构、双Q网络和加权样本池改善学习性能. 基于SUMO的实验表明, 该模型能够有效地协同提高有轨电车与社会车辆的通行效率.
近年来,随着我国城市面积的不断扩大与城市人口的迅速增长,城市居民日常出行难的问题变得越来越突出,而大力发展公共交通系统是解决这一问题的有效途径。 现代有轨电车作为一种电力驱动的轻型轨道车辆,与公共汽车相比,有着更大的载客量与更快的运行速度,能够更有效地改善城市交通拥堵,缓解公共出行压力。然而,在实际应用中有轨电车常在通过轨道/公路交叉道口时与社会车辆发生通行冲突,影响其运行效率与可靠性。 如何更好的发挥有轨电车方便快捷的特性?如同其他类型公交车辆,信号优先控制是解决上述问题、提高有轨电车服务水平的关键技术之一。最早的信号优先控制出现在上世纪六十年代,经过了近60年的不断研究,信号优先控制取得了长足的发展。然而,在现有的研究中仍然存在一些亟待解决的问题,如复杂交通环境难以建模、优化求解较为复杂等等。 作为一种“数据驱动”的无模型自学习算法,深度强化学习(Deep reinforcement learning) 可以在不进行交通建模的前提下,仅采用实时交通信息作为输入,对交叉口控制信号进行实时决策。 本文提出了一种基于深度强化学习的有轨电车信号优先控制策略。在有轨电车整个通行过程中连续动态地调整交通信号,协同考虑有轨电车与社会车辆的通行需求,在尽量保证有轨电车无需停车的同时,降低社会车辆的通行延误。采用深度Q 网络算法进行问题求解,并利用竞争架构、双Q 网络和加权样本池改善学习性能。基于SUMO 的实验表明,该模型能够有效地协同提高有轨电车与社会车辆的通行效率。 作者简介 王云鹏 大连理工大学控制理论与控制工程专业博士研究生. 主要研究方向为智能车路协同系统. E-mail: yunpengwang0306@163.com 郭 戈 东北大学教授. 主要研究方向为智能交通系统、共享出行系统、信息物理融合系统. 本文通信作者. E-mail: geguo@yeah.net
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-26 04:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社