自动化技术论文_一种棋类计算机博弈强化学习智

12-17

文章摘要:提出一种针对棋类智能体,基于显著图的解释方法,用来解释棋类智能体的决策依据,该解释方法将智能体面对的棋局状态分为落子区域和空白区域,从特征与最终决策的相关性和重要性两方面对棋局落子区域特征进行显著性分析,同时从博弈行为角度出发,分析棋局空白区域特征对于智能体决策的显著性,将两区域的特征显著性进行合并输出,从而较为全面地评估整个棋局上特征的显著性。最终针对基于强化学习的围棋智能体和国际象棋智能体,使用该方法对智能体的决策进行解释性输出,实验结果表明:可以全面地解释智能体的决策依据,验证了该方法的有效性。

文章关键词:

论文分类号:TP18

上一篇:水产和渔业论文_水产养殖不同物种对水体和沉积
下一篇:没有了