TY -的A2 Payandeh Shahram AU -王,彭AU -李,小强盟歌,春晓AU -翟,队友王士鹏PY - 2020 DA - 2020/02/01 TI -轮式机器人的动态路径规划的研究基于深度强化学习斜率地面SP - 7167243六世- 2020 AB -现有的动态路径规划算法不能正确解决轮式机器人的路径规划问题的地面上斜率与动态移动的障碍。针对DDQN训练阶段收敛速度慢的问题,提出了基于树-双深度Q网络(TDDQN)的动态路径规划算法。该算法通过优化树结构,抛弃检测到的不完整路径和过检测路径,并将DDQN方法与树结构方法相结合。首先,利用DDQN算法在当前状态下选择动作较少的最优动作,从而得到满足条件的候选路径。然后根据所得到的状态,重复执行上述过程,形成树形结构的多条路径。最后,使用非最大抑制方法从多个符合条件的候选路径中选择最佳路径。ROS仿真和实验验证了轮式机器人在有移动障碍物的斜坡地面上能够有效到达目标。结果表明,与DDQN算法相比,TDDQN具有收敛速度快、函数损耗小的优点。SN - 1687-9600 UR - https://doi.org/10.1155/2020/7167243 DO - 10.1155/2020/7167243 JF - Robotics Journal PB - Hindawi KW - ER -