详细解释:
直接研究激活(Investigate activations directly) 在确定了许多人类概念可以从Alphazero的训练后激活中预测出来后,就可以开始研究这些网络神经元的激活究竟是什么情况了。 研究人员使用非负矩阵因子分解(NMF)技术将AlphZero的表征分解为多个因子。这种方法提供了与现有人类概念无关的信息,也提供了AlphaZero网络计算内容的补充视图。 直接测量单神经元激活和输入之间的协方差也是一种方案,这种方法能够提供输入特征的组合,找到哪些特征的存在与给定神经元的激活最相关。
|