文件大小:1.15M
摘要:针对无蜂窝(CF)下行多用户多输入多输出(MIMO)系统中具有时延违反率约束及功率约束的频谱效率最大化问题,提出了一种基于安全强化学习(Safety-RL)框架内嵌加权最小均方误差(WMMSE)算法的数模协同资源调度方法。该方法将原始问题转化为2个耦合子问题:Safety-RL算法通过学习状态特征,输出用户优先级权重并分配带宽;WMMSE算法根据用户优先级权重,计算预编码矩阵并进一步调度资源,得到Safety-RL的奖励及代价。考虑CF下用户动态接入,提出具备用户可扩展性的分布式调度方案。仿真结果表明,所提方法能在保证不同用户时延违反率约束的前提下提高系统频谱效率,与完全集中式的算法相比,分布式方案的性能表现相近,但可以有效减少用户动态接入时的额外模型训练开销。
文章目录
1 System Model
1.1 Transmission model
1.2 Queueing and delay model
2 Problem Formulation and Solution
2.1 Problem formulation
2.2 Model- and data-driven scheme
2.3 CMDP model and Safety-RL algorithm
2.4 System implementation combined with the WMMSE algorithm
3 Simulation and Discussion
4 Conclusions