分享好友 文档首页 文档分类 切换分类

基于性能建模的深度学习训练任务调度综述

2024-06-22 18:58450下载
文件类型:PDF文档
文件大小:2.61M

  近年来,深度学习研究成果在全球范围内得到广泛应用.为了提高大规模深度学习模型的训练效率,业界通常采用建设GPU集群并配置高效的任务调度器的策略.然而,深度学习训练任务具有性能异构性和放置拓扑敏感性等复杂性能特性.对性能无感知的调度容易导致资源利用率低下、训练效率差等问题.为了应对这一挑战,近期涌现出大量基于性能建模的深度学习训练任务调度器.这些调度器通过构建精确的性能模型,深入了解任务的复杂性能特性,并据此设计更优化的调度算法,从而形成更高效的调度方案.本文首先基于建模设计思路,对目前调度器使用的性能建模方法进行分类综述.随后,根据调度器利用性能建模的调度优化途径,对现有的任务调度工作进行了系统性的分析.最后,对性能建模与调度在未来的研究方向进行了展望.



登录 后下载文档


1/26专辑:论文下载

举报
收藏 0
打赏 0
评论 0