摘要:针对现有手足口病发病预测模型的准确率较低且可解释性较差的问题,综合多种气象因素,提出一种基于自回归差分移动平均模型(Autoregressive integrated moving average model, ARIMA)、长短时记忆网络(Long short-term memory, LSTM)、极度梯度提升树(Extreme gradient boosting, XGBoost)、灰狼优化算法(Grey wolf optimizer, GWO)、遗传算法(Genetic algorithm, GA)和沙普利加和解释(Shapley additive explanations, SHAP)的可解释性预测模型ARIMA–LSTM–XGBoost。首先,使用ARIMA模型捕捉数据中的线性趋势进行预测并得到残差数据;其次,将残差数据输入到LSTM神经网络中,并采用GWO算法对LSTM算法中的关键参数进行自适应寻优,以捕捉复杂的非线性关系和长期依赖性;再次,利用GA算法的全局搜索能力,对XGBoost算法的参数进行优化,弥补XGBoost收敛较慢的缺陷;最后,采用误差倒数法对改进的ARIMA–LSTM与XGBoost算法进行融合,以提升模型的预测准确度,并使用SHAP方法对该模型的特征重要性进行归因和可解释性分析。基于南方某城市2014—2019年手足口病日发病数及气象监测数据,进行了手足口病发病数预测的对比实验,结果表明,相比于其他机器学习预测模型,ARIMA–LSTM–XGBoost模型具有更高的预测准确率,能够准确地预测手足口病发病数以及高效地发现手足口病患病的潜在特征。
文章目录
1手足口病日发病情况预测架构
1.1 数据获取层
1.2 特征提取层
1.3 模型预测层
1.4 评估与解释层
2基于ARIMA–LSTM–XGBoost的手足口病日发病人数预测方法
2.1 ARIMA模型
2.2 GWO算法优化LSTM
2.3 GA算法优化XGBoost
2.4 基于误差倒数法的模型融合
3 实验与结果讨论
3.1 数据来源
3.2 数据预处理
3.3 评价指标
3.4 参数设置
3.5 实验结果分析
3.5.1 模型融合的有效性
3.5.2 参数优化的有效性
4模型可解释性分析
5 结论