计算机软件及计算机应用论文_基于自编码器与集
09-29文章摘要:针对基于自编码器的离群点检测算法在中小规模数据集上易过拟合以及传统的基于集成学习的离群点检测算法未对基检测器进行优化选择而导致检测精度低的问题,提出了一种以自编码器作为基检测器的集成学习离群点检测(EAOD)算法。首先,随机改变自编码器的连接结构生成不同的基检测器,以获取数据对象的离群值和离群程度标记值;然后,通过近邻算法计算数据对象之间的欧氏距离,在对象周围构建局部区域;最后,根据离群值与离群程度标记值之间的相似度,选择在该区域内检测能力强的基检测器进行组合,组合后的对象离群值作为EAOD算法最终判定的离群值。所提算法与自编码器(AE)算法相比,在Cardio数据集上,AUC和AP值分别提高了8.08和9.17个百分点;与特征装袋(FB)集成学习算法相比,在Mnist数据集上,运行时间成本降低了21.33%。实验结果表明,在无监督学习下该算法具有良好的检测性能和检测实时性。
文章关键词:
论文分类号:TP311.13;TP181
上一篇:高等教育论文_成渝城市群高校R&D知识溢出与区
下一篇:没有了