TY - JOUR A2 - Vanajakshi,Lelitha AU - 周,杨盟 - 福,瑞盟 - 王,张PY - 2020 DA - 2020年11月21日TI - 学习司机使用最大熵深逆强化学习的跟车行为SP - 4752651 VL - 2020 AB - 本研究提出了一种基于最大熵的深度逆钢筋学习驾驶员的汽车跟踪行为的框架。所提出的框架使得能够学习由完全连接的神经网络表示的奖励功能,从驱动数据,包括驾驶员的车辆的速度,与前导车辆的距离和相对速度。使用具有42个驱动器的两个现场测试的数据。在将参与者聚集到攻击性和保守群体之后,使用汽车之后的数据来培训所提出的模型,完全连接的神经网络模型和经常性神经网络模型。采用五倍交叉验证方法,该模型被证明有不同的型号中最低的均方根误差百分比和改进豪斯多夫距离,表现出再现司机跟车行为能力超群。此外,所提出的模型在汽车跟踪场景期间捕获了不同驾驶风格的特征。学习的奖励和策略与两组的示范一致。逆钢筋学习可以作为解释和模拟驾驶行为的新工具,为人类自主驾驶模型的发展提供参考。SN - 0197-6729 UR - https://doi.org/10.1155/2020/4752651 DO - 10.1155 /四百七十五万二千六百五十一分之二千○二十零JF - 中华先进交通PB - Hindawi出版KW - ER -