首页 > 文档 > 学术/知识/论文 > 工程科技与自然科学 > 武器工业与军事技术

沙普利值分解的动态兵力部署策略规划方法

2025-06-21 920 1.16M 0

　　摘要：针对动态兵力部署问题，提出了一种基于沙普利值分解多智能体强化学习的策略规划方法，借助沙普利值分解来解释协作多智能体之间的奖励分配，利用基于沙普利分解强化学习方法求解马尔可夫凸博弈策略；针对海空跨域协同对抗场景，分析异构多实体协同对抗中空间域作战资源的分配，构建动态兵力部署策略规划模型，设计问题的状态空间、动作空间和奖励函数。围绕典型应用场景，利用兵棋推演系统对动态兵力部署问题组织了仿真实验验证，结果表明本文所提方法与多类基线算法相比在动态兵力部署策略规划方面性能优异，同时理论上具备可解释性，学到了“层层拦截、分区对抗，掩护核心、分层破击”长时域动态兵力部署策略。

　　文章目录

　　1 沙普利值分解强化学习方法

　　1.1 可转移效用博弈及公平分配

　　1.2 马尔可夫凸博弈

　　1.3 沙普利值分解及其近似

　　1.3.1 可解释性

　　1.3.2 沙普利值分解

　　1.3.3 蒙特卡洛近似

　　2 动态兵力部署策略规划问题建模

　　2.1 动态兵力部署场景描述

　　2.2 动态兵力部署策略规划

　　2.3 动态兵力部署特征工程

　　2.3.1 状态空间设计

　　2.3.2 动作空间设计

　　2.3.3 奖励函数设计

　　3 仿真设计与实验分析

　　3.1 学习框架与参数配置

　　3.2 实验结果与分析

　　3.3 长时域策略分析

　　4 结论

您还没有登录，请登录后查看详情

沙普利值多智能体强化学习兵力部署策略规划

下一篇：拓展人类命运共同体研究的文化新领域与新思路——评《全球化进程中共同体的文化构建研究》
上一篇：荔枝炭疽病相关NBS-LRR基因鉴定及功能分析

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注4
~~没有留下签名~~~~

本类推荐

	二回路典型蒸汽管路流噪声特性分析
	填充介质对组合式多药型罩射流的影响研究
	空基杀伤链网络关键边识别方法
	海上作战用电能源技术应用分析
	2024年美军无人装备领域发展分析
	2024年国外高超声速技术领域发展综述
	RCSA-YOLO：改进YOLOv8的SAR舰船实例分割
	外军高超声速武器作战及其目标杀伤链构建分析
	空空导弹上舰制动冲脱安全性评估方法研究
	导弹环境例行试验样本量优化研究

下载排行