文件大小:1.99M
摘要:近年来,以大模型为代表的通用人工智能迅速发展,准确高效测算大模型训练需求及合理选择硬件设备与网络拓扑成为关键挑战。针对这一挑战,提出一种改进的多目标常青藤优化算法来优化智算中心的资源配置。首先,根据模型训练中硬件需求和网络拓扑结构约束,建立多目标混合整数规划模型,旨在最小化算力集群搭建成本和模型训练完成时间。然后,提出改进的多目标常青藤优化算法,引入活力因子来评估种群的多样性。根据当前种群的活力自适应选择种群更新策略,平衡种群的多样性和收敛性。仿真实验将本文算法与MOPSO、NSGA-II,SPEA-II进行对比,结果表明本文算法有效可行。此外,灵敏度分析实验验证了张量并行度和流水线并行度对配置方案的影响。
文章目录
0 引言
1 问题描述
1.1 符号定义
2 数学模型
2.1 中间量的计算
2.2 模型构建
3 多目标常青藤优化算法设计
3.1 解的编码与解码
3.2 适应度评估
3.3 个体的更新策略
3.3.1 反向学习策略
3.3.2 进化策略
3.3.3 高斯变异策略
3.3.4 活力因子
3.4 算法流程
4 数值实验
4.1 数据集
4.2 实验设置
4.3 实验结果分析
4.3.1 MOIOA的收敛性
4.3.2 更新策