TY -的A2 Pennock戈登·r . AU - Lei,小云盟——张Zhian盟——咚,Peifang PY - 2018 DA - 2018/09/18 TI -动态路径规划的未知环境中基于深度强化学习SP - 5781591六世- 2018 AB -未知的动态路径规划对移动机器人环境一直是一个挑战。本文将DeepMind在2016年提出的双q网络(double Q-network, DDQN)深度强化学习应用于未知环境的动态路径规划。针对训练阶段的不稳定性和环境状态空间的稀疏性,设计了奖惩函数和训练方法。在不同的训练阶段,动态调整起始位置和目标位置。随着神经网络的更新和贪婪规则概率的增加,agent搜索的局部空间得到扩展。PYTHON中的Pygame模块用于建立动态环境。以激光雷达信号和局部目标位置为输入,利用卷积神经网络(CNNs)对环境状态进行泛化。Q-learning算法增强了智能体在环境中的动态避障能力和局部规划能力。结果表明,经过不同动态环境的训练和新环境的测试,agent能够在未知动态环境下成功到达局部目标位置。SN - 1687-9600 UR - https://doi.org/10.1155/2018/5781591 DO - 10.1155/2018/5781591 JF - Robotics Journal PB - Hindawi KW - ER -