IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深度强化学习的有轨电车信号优先控制

已有 1546 次阅读 2020-3-23 15:45 |系统分类:博客资讯

现有的有轨电车信号优先控制系统存在诸多问题, 如无法适应实时交通变化、优化求解较为复杂等. 本文提出了一种基于深度强化学习的有轨电车信号优先控制策略. 不依赖于交叉口复杂交通建模, 采用实时交通信息作为输入, 在有轨电车整个通行过程中连续动态调整交通信号. 协同考虑有轨电车与社会车辆的通行需求, 在尽量保证有轨电车无需停车的同时, 降低社会车辆的通行延误. 采用深度Q网络算法进行问题求解, 并利用竞争架构、双Q网络和加权样本池改善学习性能. 基于SUMO的实验表明, 该模型能够有效地协同提高有轨电车与社会车辆的通行效率.


近年来,随着我国城市面积的不断扩大与城市人口的迅速增长,城市居民日常出行难的问题变得越来越突出,而大力发展公共交通系统是解决这一问题的有效途径。



现代有轨电车作为一种电力驱动的轻型轨道车辆,与公共汽车相比,有着更大的载客量与更快的运行速度,能够更有效地改善城市交通拥堵,缓解公共出行压力。然而,在实际应用中有轨电车常在通过轨道/公路交叉道口时与社会车辆发生通行冲突,影响其运行效率与可靠性。 


如何更好的发挥有轨电车方便快捷的特性?如同其他类型公交车辆,信号优先控制是解决上述问题、提高有轨电车服务水平的关键技术之一。最早的信号优先控制出现在上世纪六十年代,经过了近60年的不断研究,信号优先控制取得了长足的发展。然而,在现有的研究中仍然存在一些亟待解决的问题,如复杂交通环境难以建模、优化求解较为复杂等等。


作为一种“数据驱动”的无模型自学习算法,深度强化学习(Deep reinforcement learning) 可以在不进行交通建模的前提下,仅采用实时交通信息作为输入,对交叉口控制信号进行实时决策。


本文提出了一种基于深度强化学习的有轨电车信号优先控制策略。在有轨电车整个通行过程中连续动态地调整交通信号,协同考虑有轨电车与社会车辆的通行需求,在尽量保证有轨电车无需停车的同时,降低社会车辆的通行延误。采用深度Q 网络算法进行问题求解,并利用竞争架构、双Q 网络和加权样本池改善学习性能。基于SUMO 的实验表明,该模型能够有效地协同提高有轨电车与社会车辆的通行效率。


引用格式:王云鹏, 郭戈. 基于深度强化学习的有轨电车信号优先控制. 自动化学报, 2019, 45(12): 2366−2377.

链接:http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190164

作者简介


王云鹏 大连理工大学控制理论与控制工程专业博士研究生. 主要研究方向为智能车路协同系统.

E-mail: yunpengwang0306@163.com


郭 戈 东北大学教授. 主要研究方向为智能交通系统、共享出行系统、信息物理融合系统. 本文通信作者. 

E-mail: geguo@yeah.net




https://blog.sciencenet.cn/blog-3291369-1224900.html

上一篇:热点论文TOP10
下一篇:【热点综述】2019年综述TOP20
收藏 IP: 103.254.68.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-8-2 21:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部