||
驾驭未来,随车应“变”:一种融入驾驶风格认知的两阶段
轨迹规划方法
一 导读
混行交通场景下,自动驾驶车辆需要频繁与其他道路交通参与者进行社会互动,其轨迹规划显著受到周围车辆的驾驶风格和不确定行为的影响。如何让自动驾驶车辆在复杂多变的高动态环境中规划出安全合理的行驶轨迹,已成为当前亟待解决的难题。为了应对这一挑战,安徽大学王晓教授及其团队提出了一种新颖的考虑驾驶风格认知的两阶段轨迹规划方法,该方法特别考虑了周围人类驾驶车辆的驾驶风格以及驾驶意图,以应对复杂交叉路口场景中其他车辆的不确定性社会互动行为,从而在保证车辆驾驶安全的前提下,实现更加高效的自动驾驶决策。该研究形成了名为“Safety-Balanced Driving-Style Aware Trajectory Planning in Intersection Scenarios With Uncertain Environment”的论文成果,已被《IEEE Transactions on Intelligent Vehicles》期刊接受并发表在2023年第8卷第4期。
1. Wang et al. Safety-balanced driving-style aware trajectory planning in intersection scenarios with uncertain environment[J]. IEEE Transactions on Intelligent Vehicles, 2023, 8(4):2888- 898.
2. Wang, Xiao and Tang, Ke and Dai, Xingyuan and Xu, Jintao and Xi, Jinhao and Ai, Rui and Wang, Yuxiao and Gu, Weihao and Sun, Changyin. Safety-balanced driving-style aware trajectory planning in intersection scenarios with uncertain environment[J]. IEEE Transactions on Intelligent Vehicles, 2023, 8(4):2888- 898.
全文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10026339
二 论文介绍
1 研究背景
自动驾驶车辆(SDV)在城市交叉路口场景下的轨迹规划是一项具有挑战性的任务,因为它涉及到与周围的人类驾驶车辆(HDV)进行复杂的社会交互过程。HDV的驾驶行为受到其驾驶风格和驾驶意图的影响,这些因素会导致驾驶行为的不确定性和多样性。因此,学习和分析道路交通参与者的驾驶风格以及意图对于SDV轨迹规划至关重要。SDV需要准确地预测HDV的未来轨迹,并根据场景的动态变化做出合适的规划,以保证安全和高效的驾驶决策。然而,已有工作中所涉及的轨迹规划方法(例如基于规则的方法和数据驱动的方法)存在不足,其忽略了HDV的驾驶风格和驾驶意图对SDV的影响,因而无法有效应对驾驶环境中的不确定性和多模态性。这导致自动驾驶车辆在复杂高动态场景下的轨迹规划变得异常困难,并且无法保证自动驾驶车辆在行使过程中的安全性。
2 框架概览
本文提出了一种两阶段轨迹规划方法,以处理复杂交叉路口场景下HDV驾驶行为不确定性导致SDV轨迹规划困难的问题。论文方法框架如图1所示。该方法包括两个阶段:第一阶段通过混合专家模型学习人类驾驶的轨迹数据,构建多模态轨迹生成器。它利用Transformer网络捕捉车辆之间的交互行为,并明确模拟周围HDV的驾驶风格,以生成与人类驾驶经验一致的多模态候选轨迹。第二阶段则通过安全验证模块,对第一阶段生成的候选轨迹进行评估和打分,最终选择最安全的轨迹用于下游控制器执行。通过在Lyft数据集上的实验,该研究证明了所提方法在安全性、合理性和鲁棒性方面的优越性能。
图1 基于两阶段安全平衡驾驶风格认知轨迹规划框架
3 实验设计及验证
3.1 实验设计
(1)输入输出:轨迹预测模型根据当前观察到的矢量化鸟瞰视图状态生成SDV多模态轨迹候选轨迹和周围HDV多模态预测轨迹。其中,模型输入包含动态实体、静态实体和额外信息。动态实体包括SDV当前和过去的位姿;静态实体包括带有车道、人行横道、十字路口和交通灯状态的静态高清地图;额外信息包括指示SDV应遵循的中间车道的路线。模型的输出由三个部分组成:多模态轨迹规划、驾驶风格识别和周围车辆的多模态轨迹预测。
(2)目标函数:模型通过模仿学习训练联合预测-规划网络,将联合预测规划模型表示为混合专家模型(MoE)。训练目标函数包括最小化预测轨迹与专家真实轨迹的距离、最小化预测的HDV轨迹与其真实未来轨迹的距离、最小化HDV驾驶风格标签与真实驾驶风格标签之间的距离。其中,MOE模型指通过模仿学习训练联合预测-规划网络,将联合预测规划模型表示为混合专家模型(MoE),用于预测SDV和周围HDV的多个轨迹。为了避免专家训练和专家选择过程中的模式崩溃问题,本文使用贪婪方法,选择最大概率轨迹进行损失计算。本文在预测和目标轨迹和概率之间制定匹配成本,其损失函数定义为:
(3)驾驶风格识别:驾驶风格识别网络通过预测和规划网络以端到端的方式进行训练,包括三个步骤:生成轨迹数据集、从轨迹数据集中生成速度和加速度数据集以及识别每个场景中周围人类驾驶员的驾驶风格。其中,根据车辆轨迹生成瞬时训练集中的每个场景,通过捕获车辆轨迹的速度和加速度创建数据集,并通过无监督的Kmeans聚类获得驾驶风格标签。驾驶风格识别模型根据周围车辆当前和过去的状态识别其驾驶风格,目标函数设计为:
(4)安全校验方法:基于候选轨迹预测的安全验证机制,即构造“安全平衡”的轨迹评价函数,以平衡轨迹规划的安全性和效率。安全验证机制通过将SDV每个未来轨迹与HDV进行碰撞检查,通过计算车辆边界框之间的重叠区域和SDV与车道中线的距离来执行安全验证,公式如下:
3.2 实验结果分析
(1)数据集与评价指标:为了验证该方法的有效性,本实验采用Lyft运动预测数据集,该数据集收集自加州帕洛阿尔托市的真实驾驶场景,包括多车道行驶、转弯和十字路口交互等。数据集含高清地图信息,记录了车辆位置、车道线、人行横道和交通灯状态。实验通过闭环和开环测试评估模型,闭环测试验证安全性,开环测试衡量规划轨迹与实际驾驶轨迹的距离。评价指标包括碰撞(Collisions)、L2误差、偏离路线事件(Off-road events)、干预(Interventions)、平均位移误差(ADE)和最终位移误差(FDE)。
表1 闭环测试结果
表2 开环测试结果
(2)性能分析
l定量结果分析:表Ⅰ和表Ⅱ给出开环与闭环定量测试结果。实验结果表明,本文的方法在闭环测试中,具有最低的碰撞率和越界事件数。在1000个场景中,我们的方法总共导致了62次碰撞,这是所有对比方法中效果最好的,说明本文的方法在复杂的交互场景中具有更高的安全性和合理性。在开环测试中,本文的方法在平均位移误差和最终位移误差上,均优于基准方法,说明本文的方法能够更好地模仿人类驾驶行为。此外,本文还进行了消融实验,消融模块包括驾驶风格识别(DS)和安全验证(SV),如表Ⅲ所示,其再一次验证了驾驶风格识别和安全验证模块的有效性。
表3 消融实验结果
l定性结果分析:为了进一步验证论文提出模型的合理性,我们将其与基准方法在复杂交互场景下的规划行为进行了可视化对比。如图2所示,我们的方法可以使红色的自动驾驶车辆(SDV)红灯时在交叉口停下,并在绿灯时恢复行驶,同时保持与其他车辆的安全距离,并沿着路线合理行驶。此外,模型所规划的轨迹接近人类驾驶员的蓝色参考轨迹。相比之下,基于基线BC-VP方法的车辆会闯红灯并撞到其他车辆,同时不遵循路线。这些结果进一步证明了我们提出的方法的优越性。
图2场景可视化结果分析
4 总结
本文提出了一种考虑HDV驾驶风格的安全平衡的两阶段轨迹规划方法,以解决由交叉路口场景中周围交通参与者的行为不确定性引起的SDV轨迹规划困难的挑战。两阶段规划方法主要包括基于驾驶风格认知的多模态候选轨迹生成和基于安全平衡验证的轨迹选择。在第一阶段,模型根据驾驶风格识别和意图推断预测周围HDV的未来轨迹,并同时生成符合SDV在交互场景中的人类驾驶经验的多模态候选轨迹。在第二阶段,根据第一阶段生成的候选轨迹和预测的HDV轨迹,本文根据经验构建的规则对轨迹进行安全值评分,并选择最安全的驾驶路径进行最终执行。未来的工作中,我们计划将提出的两阶段方法与认知世界模型相结合,以更好地推广SDV轨迹规划策略。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 03:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社