首页 > 文档 > 学术/知识/论文 > IT/计算机/信息技术 > 计算机硬件技术

基于Cache功能模拟的GPU内存系统建模

2025-04-24 390 1.4M 0

　　摘要：重用距离分析是一种常用的基于 Trace 的 Cache性能分析方法。然而，随着现代 GPU 微架构的持续演进，现有基于重用距离理论的 GPU 内存分析模型由于简化了过多硬件特性，导致了显著的失真。为此，本文提出一种基于Trace和Cache功能模拟的GPU内存系统建模框架，针对现代GPU的关键内存特性进行了精确建模，包括Sector Cache、自适应L1缓存分配机制以及写直达与写回策略等。通过在Volta架构及多个基准测试套件上的实验验证，论文模型相较现有最先进模型PPT-GPU-Mem在多个关键指标上显著提升了预测精度：L2命中率误差从43.39% 降至15.86%，显存读写事务次数误差从42%降至16.85%。

　　文章目录

　　0 引言

　　1 相关工作

　　2 研究背景

　　2.1 GPU 存储层次

　　2.2 CUDA 线程层次与调度

　　2.3 SDCM 模型

　　2.4 PPT-GPU-Mem 框架

　　3 PPT-GPU-Mem 的不足

　　3.1 Cache 访存粒度

　　3.2 L2 Trace 构造

　　3.3 显存读写事务建模

　　4 改进的内存模型

　　4.1 Cache 功能模拟

　　4.2 自适应 L1 Cache

　　5 实验结果与分析

　　5.1 实验设置

　　5.2 结果分析

　　5.2.1 L1 缓存结果分析

　　5.2.2 L2 缓存结果分析

　　5.2.3 显存结果分析

　　5.3 敏感性测试

　　5.3.1 Sector Cache影响

您还没有登录，请登录后查看详情

GPU 内存模型重用距离功能模拟 NVIDIA NVBit

下一篇：含混合储能的负荷频率控制系统在间歇控制下的稳定性
上一篇：基于SRP模型的江西省生态脆弱性变化及驱动机制

点赞 0举报收藏 0打赏 0评论 0

久存网超级..
加关注4
~~没有留下签名~~~~

本类推荐

	基于myRIO-1900实现2704个自旋的伊辛机
	实时系统中的逻辑执行时间模型研究综述
	实时系统中基于测量的概率时序分析：模型、方法与验证
	基于指导语句的函数向量化技术研究
	LRCRaft:支持节点数据快速恢复的共识协议
	基于进化自适应蝙蝠算法的异构多核处理器任务调度
	基于GSLF-SSA的异构多核处理器任务调度
	申威平台高速网络数据处理框架的设计与实现

下载排行