分享好友文档首页文档分类切换分类

沙普利值分解的动态兵力部署策略规划方法

2025-06-21 16:191490下载

久存网超级管理
加关注4
~~没有留下签名~~~~

文件类型：PDF文档
文件大小：1.16M

　　摘要：针对动态兵力部署问题，提出了一种基于沙普利值分解多智能体强化学习的策略规划方法，借助沙普利值分解来解释协作多智能体之间的奖励分配，利用基于沙普利分解强化学习方法求解马尔可夫凸博弈策略；针对海空跨域协同对抗场景，分析异构多实体协同对抗中空间域作战资源的分配，构建动态兵力部署策略规划模型，设计问题的状态空间、动作空间和奖励函数。围绕典型应用场景，利用兵棋推演系统对动态兵力部署问题组织了仿真实验验证，结果表明本文所提方法与多类基线算法相比在动态兵力部署策略规划方面性能优异，同时理论上具备可解释性，学到了“层层拦截、分区对抗，掩护核心、分层破击”长时域动态兵力部署策略。

　　文章目录

　　1 沙普利值分解强化学习方法

　　1.1 可转移效用博弈及公平分配

　　1.2 马尔可夫凸博弈

　　1.3 沙普利值分解及其近似

　　1.3.1 可解释性

　　1.3.2 沙普利值分解

　　1.3.3 蒙特卡洛近似

　　2 动态兵力部署策略规划问题建模

　　2.1 动态兵力部署场景描述

　　2.2 动态兵力部署策略规划

　　2.3 动态兵力部署特征工程

　　2.3.1 状态空间设计

　　2.3.2 动作空间设计

　　2.3.3 奖励函数设计

　　3 仿真设计与实验分析

　　3.1 学习框架与参数配置

　　3.2 实验结果与分析

　　3.3 长时域策略分析

　　4 结论

请登录后下载文档

点赞 0

举报

收藏 0

打赏 0

评论 0

拓展人类命运共同体研究的文化新领域与新思路——评《全球化进程中共同体的文化构建研究》
0下载140浏览0.86M

新型刚柔混联连续体机器人机构设计与运动建模
0下载109浏览2.41M

不同利用方式下温性草甸草原土壤碳氮磷化学计量比高光谱反演
0下载152浏览1.86M

基于文献计量的道路生态影响研究进展
0下载133浏览2.21M

信息技术迅猛发展形势下我国文化对外传播的新范式
0下载91浏览1M

重庆城口板栗种质资源坚果多样性分析及评价
0下载119浏览1.3M

数据要素的新质生产力驱动效应——来自城市数据交易平台设立的证据
0下载120浏览1.15M

春季休牧对东祁连山高寒草甸土壤胞外酶活性和微生物代谢限制的影响
0下载109浏览1.59M

指向大概念的小学信息科技跨学科主题学习：为何与何为
0下载120浏览0.5M

北方城市社区绿地景观格局特征及其影响因素研究
0下载114浏览1.94M