文件大小:1.09M
在入侵检测应用中,机器学习算法发挥着至关重要的作用,特征选择作为关键的数据预处理步骤,可以有效提升分类器的分类效果.而现有的特征选择算法未考虑数据分布不均匀时特征间存在的伪相关性,影响了分类器的泛化能力.针对此问题,本文提出了一种混合特征选择的朴素贝叶斯网络入侵检测算法,将相关性度量准则引入特征提取阶段,避免特征间存在的伪相关性,更好地满足朴素贝叶斯算法的强假设,使模型检测性能有效提升.该方法采用了两步特征选择策略:第一步筛选数据集中和类变量相关性较强特征;第二步去除冗余特征,筛选出相互条件独立的特征作为特征子集,并将此特征子集送入朴素贝叶斯算法进行检测.实验结果表明,提议的方法在检测率和泛化性能上都优于参与对比的6个传统机器学习算法,并且在一定程度上克服了数据分布不平衡导致的精度低的问题,与近期提出的两个深度学习算法相比较,在准确率和精确率上优于两个对比深度学习算法.