研究紹介

深層生成モデルによる非正則化異常度を用いた異常検知

異常検知とは多くのデータから仲間外れを見つけることです.例えば工場の生産ラインから不良品を見つけたり,監視カメラ映像から不審者を見つけたり,様々な応用例が考えられます.一般にはデータごとに頻出度(尤度)を計算し,それが低いデータは非典型的である,つまり異常であるとみなします.深層生成モデルは深層学習を用いて構築した確率モデルであり,画像のような生データの尤度を測ることができます.そのため,多くの分野で異常検知の手法として使われています.

より具体的には,深層生成モデルは与えられた画像を非可逆圧縮し,元通りに復元するように学習されます.非可逆圧縮なので必ず情報は欠損しますので,深層生成モデルは頻出する典型的なデータを優先して復元するように学習し,非典型的なデータの復元を諦めます.すると,復元できなかったデータ=非典型的なデータ=異常,という考えが成り立ちます.

しかし,実際にはそのとおりには行きません.復元できない状態を「数理モデルに不確実性がある」と表現します.そしてその原因は2つあります.1つは「経験的不確実性(epistemic uncertainty)」と呼ばれるもので,学習(=経験)が不足しているために,数理モデルがデータを正しく表現できない状態です.深層生成モデルは数の多い典型的なデータを優先して学習するため,非典型的なデータの学習は疎かになります.つまり非典型的なデータに対する学習が不足してる状態であり,異常検知はこの経験的不確実性を使っていると考えられます.もう一つは「偶然的不確実性(aleatoric uncertainty)」です.こちらはデータにそもそもノイズが多い,複雑な形をしている,といったモデル側に非がない不確実性です.そして,現実世界のデータはしばしばこの偶然的不確実性が非常に高いという状態が起こります.

例えば工場で生産される金属部品には,平べったい表面と,ネジ穴や勘合部分などの複雑な形状をした部分があります.平べったい表面に傷が入ればそれは経験的不確実性です.しかしネジ穴や勘合部分は形状が複雑すぎて,すでに高い偶然的不確実性を持っています.すると異常検知において,表面の傷を見落とし,ネジ穴を誤検出するということが起こります.

そこで深層生成モデルの尤度を計算する式を改良し,経験的不確実性に関する項と偶然的不確実性に関する項に分けることができました.この経験的不確実性に関する項を非正則化異常度と名付け,異常検知に使うと,見た目の複雑さに惑わされず,高い精度で異常検知を行うことができました.

本研究はアイシン・エィ・ダブリュ株式会社様との共同研究として実施された.本研究に関する発表は2018年度 人工知能学会 全国大会優秀賞 (一般セッション口頭部門) を受賞しました.

Qiitaに解説記事を書いてくださった方がいらっしゃいました.ありがとうございます.

  • Takashi Matsubara, Kazuki Sato, Kenta Hama, Ryosuke Tachibana, and Kuniaki Uehara, “Deep Generative Model using Unregularized Score for Anomaly Detection with Heterogeneous Complexity,” IEEE Transactions on Cybernetics, vol. 52, no. 6, pp. 5161-5173, 2022. (arXiv) (link)
  • Takashi Matsubara, Ryosuke Tachibana, and Kuniaki Uehara, “Anomaly Machine Component Detection by Deep Generative Model with Unregularized Score,” Proc. of The 2018 International Joint Conference on Neural Networks (IJCNN2018), Rio de Janeiro, Jul. 2018, pp.4067-4074. (link)

0000.jpeg

0001.jpeg

0002.jpeg

0003.jpeg