分享好友 文档首页 文档分类 切换分类

基于多步强化学习的多目标组播路由算法

2024-05-26 00:451060下载
文件类型:PDF文档
文件大小:0.85M

  摘要:当前网络中存在过度供应、冗余和拥塞等问题,导致能耗过高和用户满意度下降。联合优化能耗和延迟的组播路由问题是一个NP完全问题。在SDN架构下,提出了一种基于多步Q-Learning的多目标组播路由算法来解决延迟和能耗的组播路由问题。该算法旨在降低网络能耗和延迟,同时满足网络性能和QoS的要求。该算法基于多步Q-Learning,能够更准确地估计每条路径的长期奖励,进而通过在每个步骤中更新Q 值,为节点选择最优的动作,并最终找到最佳路径。通过将多个时间步的奖励和价值函数结合起来,能够更快地收敛到最优策略。此外,在设置奖励值时,为每一个目标赋予不同的权重,用来平衡目标所占的比重。仿真结果表明,与现有的代表性算法相比,该算法能够有效降低网络能耗和延迟,提高网络性能。

  文章目录

  0 引言

  1 相关工作

  2 系统模型和描述

  3 MOMR-MQL算法

  3.1 多步强化学习

  3.2 算法描述

  3.2.1 状态空间

  3.2.2 动作空间

  3.2.3 奖励值

  3.2.4 MOMR-MQL算法描述

  4 实验结果

  4.1 针对单个组播需求的性能评估

  4.1.1 30个节点的网络

  4.1.2 50个节点的网络

  4.1.3 100个节点的网络

  4.2 针对多个组播需求的性能评估

  5 结束语



登录 后下载文档


1/26专辑:论文下载

举报
收藏 0
打赏 0
评论 0