異常検知の最新事情と給与の話

D3b7011cad197be33366ee58fc8c4d98?s=47 palloc
January 20, 2019

 異常検知の最新事情と給与の話

D3b7011cad197be33366ee58fc8c4d98?s=128

palloc

January 20, 2019
Tweet

Transcript

  1. Deepな異常検知の最新事情 伊東 道明

  2. © 2018- ChillStack, Inc. 自己紹介 ◆ 所属 ◇ 法政大学 彌冨研究室

    M1 ◇ クマ財団 2期生 ◇ (株)ChillStack 代表取締役 ◆ 好きなこと ◇ AIセキュリティ ◇ 100m
  3. 雑談

  4. © 2018- ChillStack, Inc. 【雑談】経営者 vs エンジニア ◆ マウント合戦がアツく、何かと話題になる「年収」 ◆

    エンジニアはよく薄給な会社と戦ってるイメージ イメージ) 年収400万しかもらってな いのおかしい!! 優秀なエンジニア 無能な経営陣 400万もあげれば十分だろ。 「ヤリガイ」を与えてるんだから!
  5. © 2018- ChillStack, Inc. 【雑談】経営者視点での思考 初任給から年収5,000万円を定年退職までもらえたら、 エンジニアは最高効率で働いてくれる?

  6. © 2018- ChillStack, Inc. 【雑談】労働の要因 ◆ 内発的動機づけ ◇ 達成感 ◇

    仕事自体の楽しさ ◇ 自己の承認 ◆ 衛生要因 ◇ 給与 ◇ 職場の人間関係 ◇ 場所・機材などの環境 満足の原因 不満足の予防 詳細が気になる方は、以下のワードで検索してみてください ・デシ 心理学 実験 ・X理論 Y理論 ・ヴィクター ヴルーム 期待理論
  7. © 2018- ChillStack, Inc. 【雑談】労働の要因 ◆ 内発的動機づけ ◇ 達成感 ◇

    仕事自体の楽しさ ◇ 自己の承認 ◆ 衛生要因 ◇ 給与 ◇ 職場の人間関係 ◇ 場所・機材などの環境 満足の原因 不満足の予防 ブラックな上司や企業は大抵 片方しかみていない 詳細が気になる方は、以下のワードで検索してみてください ・デシ 心理学 実験 ・X理論 Y理論 ・ヴィクター ヴルーム 期待理論
  8. って感じの内容を考えるのが 今の仕事の一つです

  9. 経営とか気になる方は是非懇親会で…

  10. Deepな異常検知の最新事情 本題

  11. © 2018- ChillStack, Inc. 異常検知手法 ◆ ホテリング法 ◆ ナイーブベイズ法 ◆

    近傍法 ◆ OC-SVM ◆ 密度比推定 ◆ などなど k-meansとspectral clusteringを 使った異常検知の解説
  12. © 2018- ChillStack, Inc. ディープな異常検知 ◆ CNN系を用いた2値分類による異常検知 ◇ 前回はこっち ◇

    Web Application Firewall using Character-level Convolutional Neural Network ◆ GAN系を用いた異常検知 ◇ 今回はこっち
  13. © 2018- ChillStack, Inc. GANとは ◆ 生成モデルの1種(Generative Adversarial Network) G

    G(z) z x 潜在空間 観測空間 D 結果
  14. © 2018- ChillStack, Inc. GANとは G G(z) z x 潜在空間

    観測空間 D 結果 データを生成する種 (潜在変数) データ 生成器 生成データ 元データ 生成データ or 元データ か識別する識別器 GはDを騙せるように学習、 Dはちゃんと見分けられるように学習する
  15. © 2018- ChillStack, Inc. GANの近年の成果 ◆ 人にサングラスをかけさせたり ◆ 馬をシマウマにしたり ◆

    低画質な画像を超高画質にしたり ◆ めっちゃ高く売れる絵を描いちゃったり 他にも色々面白い成果を出している
  16. © 2018- ChillStack, Inc. 【GANで異常検知】基本アイディア G G(z) z x 潜在空間

    データ D 結 果 ◆ G は学習データの分布 p に従って画像を生成するモデル ◆ p に従ってサンプルしたx → G(z)≈x となる z が潜在空間に存在する ◆ p 内で低い確率 or 別の分布からサンプルしたx → 潜在空間に z が存在しない
  17. © 2018- ChillStack, Inc. 【GANで異常検知】基本アイディア G G(z) z x 潜在空間

    データ D 結 果 ◆ G(z)≈x となる z が存在しない時、x は異常 ◆ 存在しない is ? → G(z) と x がどれだけ離れているかを表す異常スコアが 閾値以上かどうかで判定
  18. © 2018- ChillStack, Inc. AnoGAN ◆ GANで異常検知する手法 ◆ 基本的にさっきのアイディアを実用化した感じ ◆

    Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery, IPMI 2017 ◆ https://arxiv.org/abs/1703.05921
  19. © 2018- ChillStack, Inc. AnoGAN 1. 普通にGANを学習させる 2. 異常か知りたいデータ x

    に一番似ている G(z) を作る z を探す 3. 異常スコアを LR と LD から計算する 4. 異常スコアが閾値を超えてたら異常 ※1 通称minmaxゲームってやつ ※1 ※2 ※2
  20. © 2018- ChillStack, Inc. AnoGAN 1. 普通にGANを学習させる 2. 異常か知りたいデータ x

    に一番似ている G(z) を作る z を探す 3. 異常スコアを LR と LD から計算する 4. 異常スコアが閾値を超えてたら異常 ※1 通称minmaxゲームってやつ ※1 ※2 ※2
  21. © 2018- ChillStack, Inc. G(z) ≈ x となる z の探索

    1. 初期値 z0 を決める 2. g(zn ) というモデル(論文内では確かfc)を作る 3. G(g(z0 )) と x の loss から g(zn ) の重みを更新 4. z1 ← g(z0 ) 5. 収束するまで 3, 4 を繰り返す G G(z) z x D 結 果 g
  22. © 2018- ChillStack, Inc. G(z) ≈ x となる z の探索

    1. 初期値 z0 を決める 2. g(zn ) というモデル(論文内では確かfc)を作る 3. G(g(z0 )) と x の loss から g(zn ) の重みを更新 4. z1 ← g(z0 ) 5. 収束するまで 3, 4 を繰り返す G G(z) z x D 結 果 g めっちゃ時間 かかる!
  23. © 2018- ChillStack, Inc. Efficient GAN ◆ Bidirectional GAN のアイディアを利用し、

    z の探索コストをほぼ無くした手法 ◆ Efficient GAN-Based Anomaly Detection ICLR worpshop 2018 ◆ https://arxiv.org/abs/1802.06222
  24. © 2018- ChillStack, Inc. Efficient GAN ◆ 学習時に Encoder も一緒に学習する

    G G(z) z x D 結果 E E(x) G(z), z x, E(x)
  25. © 2018- ChillStack, Inc. Efficient GAN ◆ 潜在空間、観測空間それぞれで loss を計算

    G G(z) z x D 結果 E E(x) G(z), z x, E(x)
  26. © 2018- ChillStack, Inc. 何が嬉しいか ◆ Encoder を使う事で z を探索する必要がなくなる

    ◆ 速い G G(z) z x D 結果 E E(x) G(z), z x, E(x)
  27. © 2018- ChillStack, Inc. 他にもいろいろ ◆ Adversarially Learned One-Class Classifier

    for Novelty Detection ◇ オートエンコーダ使ったいい感じのやつ ◆ Anomaly Detection with Generative Adversarial Networks ◇ ADGANってやつ ◆ Anomaly detection with Wasserstein GAN ◇ WGAN使ってるやつ
  28. © 2018- ChillStack, Inc. 株式会社ChillStack ◆ 異常検知プラットフォーム Stena を開発・提供 ◇

    ゲームの悪質ユーザとかを検知 ◇ ログデータ解析からサービスの品質改良・自動化を支援 ◆ 不正ユーザに悩んでいる方 ◇ 低コスト高精度なシステムを提供します。ご相談ください! ◆ ログデータはあるが、有効活用するコストが割けない方 ◇ 有効活用できるシステムを共同研究・開発します。ご相談ください!