多维时序无监督异常检测

A Deep Neural Network for Unsupervised Anomaly Detectionand Diagnosisin Multivariate Time Series Data

贡献

  • 形式化异常检测到三个子问题上:
    • 异常检测
    • 根因定位
    • 异常严重性解释
  • 提出了系统签名矩阵(system signature matrix)的概念,用MSCRED通过一个卷积编码器来编码tensor间的联系,基于注意力模型的ConvLSTM网络可以处理时间的模型。该模型首次可以解决上述三个问题
  • 性能超越baseline

MSCRED 框架

Multi-Scale Convolutional Recurrent Encoder-Decoder

大体思路: 1. 生成多尺度的系统签名矩阵 2. 通过卷积编码器把空间信息编码到签名矩阵中 3. 把时间信息编码到ConvLSTM注意力模型中 4. 根据卷积解码器重构签名矩阵,利用平方误差来进行端到端的学习

使用签名矩阵描述状态

对于时间段\(t-w\)\(t\) 这段时间内,两个时序\(x_i^w =(x_i^{t-w},x_i^{t-w-1},...,x_i^t)\)\(x_j^w =(x_j^{t-w},x_j^{t-w-1},...,x_j^t)\),联合计算 \[ m_{ij}^t = \frac{sum_{\delta=0}^\omega x_i^{t-\delta}x_j^{t-\delta}}{K} \] 其中\(K\)作为缩放因子。这个矩阵可以衡量相似性且有一定的鲁棒性,有\(m\)构成完全矩阵\(M\)

卷积下的编码器

首先将\(M^t\)用不同尺度连接成tensor \(\chi^{t,0}\in \mathbb{R}^{n*n*s}\) 然后再传入卷积层,前后两层的通过激活函数连接 \[ \chi^{t,l}=f(W^l*\chi^{t,l-1}+b^l) \] 激励函数用的是SELU

基于注意力的ConvLSTM

传统的ConvLSTM可能随着时序序列的增加,性能发生下降,为了解决这个问题,引入了注意力模型,可以根据时间戳动态采取相关隐含层(feature map)。隐含层的更新\(H^{t,l} = ConvLSTM(\chi^{t,l},H^{t-1,l})\)