基于改进深度强化学习算法的农业机器人路径规划_农业工程_农林牧副渔_学术/知识/论文_文档

文件类型：PDF文档
文件大小：1.97M

　　农业机器人采用深度强化学习算法进行路径规划时存在难以找到目标点、稀疏奖励、收敛缓慢等问题，为此提出基于多目标点导航融合改进深度Q网络算法（MPN-DQN）的路径规划方法.利用激光同步定位与建图（SLAM）扫描全局环境以构建先验地图，划分行走行和作物行区域；对地图边界进行膨胀拟合处理，形成前向弓字形作业走廊.利用中间目标点分割全局环境，将复杂环境划分为多阶段短程导航环境以简化目标点搜索过程.从动作空间、探索策略和奖励函数3个方面改进深度Q网络算法以改善奖励稀疏问题，加快算法收敛速度，提高导航成功率.实验结果表明，搭载MPN-DQN的农业机器人自主行驶的总碰撞次数为1，平均导航时间为104.27 s，平均导航路程为16.58 m，平均导航成功率为95%.