博文

[转载]融合鸟瞰图特征的模仿与强化学习自动驾驶规划方法

已有 1326 次阅读 2025-10-27 09:38 |系统分类:论文交流|文章来源:转载

融合鸟瞰图特征的模仿与强化学习自动驾驶规划方法

夏洁¹，吴晓东¹，许敏²

（1. 上海交通大学智能汽车研究所，上海200240；2. 上海交通大学机械与动力工程学院，上海200240）

摘要：端到端自动驾驶技术打破了传统自动驾驶技术模块化管道形式的桎梏，将感知、预测、规划集成在一个框架下，实现了全局优化。目前较为典型的端到端（E2E）框架都是基于深度学习规划的，需要大量真实世界的离线数据对网络进行训练，而数据的获取与管理是一件费时又费力的事情。基于深度强化学习（DRL）算法进行规划也是当今流行的一种自动驾驶技术，深度强化学习算法能够促使智能体在环境突变时通过奖励函数的引导实现自适应，但这类学习框架与感知模块之间没有强关联性，即无法实现反向传播。上述的两类学习框架各有优缺点，本文选择将两个框架融合在一起，并搭建了鸟瞰图（BEV）特征提取网络从相机拍摄的图像中提取关键交通流信息，最终构建出基于BEV特征的端到端深度强化学习规划框架，该框架使得端到端自动驾驶技术由数据驱动转化为行为驱动。为了提高网络训练速度与质量，本文还提出了先进的模仿学习算法。所提出的算法最后在CARLA仿真器中进行仿真验证，实验结果证明该算法优于其他框架下的算法，能够进一步提高智能体的安全性、高效性等。

关键词：端到端技术，深度强化学习，鸟瞰视图，模仿学习

扫二维码浏览全文

12204_OF_25_057下载.png

Cite this article

Xia, J., Wu, X. & Xu, M. BEV-Fused Imitation and Reinforcement Learning for Autonomous Driving Planning. J. Shanghai Jiaotong Univ. (Sci.) (2025). https://doi.org/10.1007/s12204-025-2851-3

转载本文请联系原作者获取授权，同时请注明本文来自黄龙旺科学网博客。
链接地址：https://blog.sciencenet.cn/blog-45888-1507613.html

上一篇：[转载]混合UKF-GRU的车辆状态估计
下一篇：[转载]面向几何复杂工件的力引导机器人装配策略及其在钢铁冶金自动化中的应用

收藏 IP: 202.120.12.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

黄龙旺

扫一扫，分享此博文

Yetta分享 http://blog.sciencenet.cn/u/yetta

博文

[转载]融合鸟瞰图特征的模仿与强化学习自动驾驶规划方法

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

黄龙旺

全部作者的其他最新博文

全部精选博文导读

Yetta分享 http://blog.sciencenet.cn/u/yetta

博文

[转载]融合鸟瞰图特征的模仿与强化学习自动驾驶规划方法

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

黄龙旺

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)