博文

基于深度强化学习的有轨电车信号优先控制

已有 1546 次阅读 2020-3-23 15:45 |系统分类:博客资讯

现有的有轨电车信号优先控制系统存在诸多问题, 如无法适应实时交通变化、优化求解较为复杂等. 本文提出了一种基于深度强化学习的有轨电车信号优先控制策略. 不依赖于交叉口复杂交通建模, 采用实时交通信息作为输入, 在有轨电车整个通行过程中连续动态调整交通信号. 协同考虑有轨电车与社会车辆的通行需求, 在尽量保证有轨电车无需停车的同时, 降低社会车辆的通行延误. 采用深度Q网络算法进行问题求解, 并利用竞争架构、双Q网络和加权样本池改善学习性能. 基于SUMO的实验表明, 该模型能够有效地协同提高有轨电车与社会车辆的通行效率.

近年来，随着我国城市面积的不断扩大与城市人口的迅速增长，城市居民日常出行难的问题变得越来越突出，而大力发展公共交通系统是解决这一问题的有效途径。

现代有轨电车作为一种电力驱动的轻型轨道车辆，与公共汽车相比，有着更大的载客量与更快的运行速度，能够更有效地改善城市交通拥堵，缓解公共出行压力。然而，在实际应用中有轨电车常在通过轨道/公路交叉道口时与社会车辆发生通行冲突，影响其运行效率与可靠性。

如何更好的发挥有轨电车方便快捷的特性？如同其他类型公交车辆，信号优先控制是解决上述问题、提高有轨电车服务水平的关键技术之一。最早的信号优先控制出现在上世纪六十年代，经过了近60年的不断研究，信号优先控制取得了长足的发展。然而，在现有的研究中仍然存在一些亟待解决的问题，如复杂交通环境难以建模、优化求解较为复杂等等。

作为一种“数据驱动”的无模型自学习算法，深度强化学习(Deep reinforcement learning) 可以在不进行交通建模的前提下，仅采用实时交通信息作为输入，对交叉口控制信号进行实时决策。

本文提出了一种基于深度强化学习的有轨电车信号优先控制策略。在有轨电车整个通行过程中连续动态地调整交通信号，协同考虑有轨电车与社会车辆的通行需求，在尽量保证有轨电车无需停车的同时，降低社会车辆的通行延误。采用深度Q 网络算法进行问题求解，并利用竞争架构、双Q 网络和加权样本池改善学习性能。基于SUMO 的实验表明，该模型能够有效地协同提高有轨电车与社会车辆的通行效率。

引用格式：王云鹏, 郭戈. 基于深度强化学习的有轨电车信号优先控制. 自动化学报, 2019, 45(12): 2366−2377.

链接：http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190164

作者简介

王云鹏大连理工大学控制理论与控制工程专业博士研究生. 主要研究方向为智能车路协同系统.

E-mail: yunpengwang0306@163.com

郭　戈东北大学教授. 主要研究方向为智能交通系统、共享出行系统、信息物理融合系统. 本文通信作者.

E-mail: geguo@yeah.net

转载本文请联系原作者获取授权，同时请注明本文来自欧彦科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3291369-1224900.html

上一篇：热点论文TOP10
下一篇：【热点综述】2019年综述TOP20

收藏 IP: 103.254.68.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

欧彦

扫一扫，分享此博文

全部作者的精选博文

• 2023年度自动化领域国家自然科学基金申请与资助情况

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深度强化学习的有轨电车信号优先控制

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深度强化学习的有轨电车信号优先控制

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

该博文允许注册用户评论请点击登录评论 (0 个评论)