密度比推定による異常検知

異常検知と変化検知 Chapter 11 密度比推定による異常検知 2015.11.04 @ MLP勉強会 Twitter @oshokawa Facebook
滝勇太

あうとらいん •  自己紹介 •  猫紹介 •  前振り〜とりあえずどんな感じか〜 •  密度比推定による異常検知
–  11.1 密度比による外れ値検出問題の定式化 –  11.2 カルバック・ライブラー密度比推定法 –  11.3 最小2乗密度比推定法 •  前振り再び •  参考文献 2

自己紹介名前：滝(石川) 勇太専門：機械学習職種：でーたさいえんてぃすと(笑) 趣味：ぬこ 3

猫を二匹飼ってます 4

かわいい 5

トロ様(左)とウニ様(右) 6

かわいい 7

ダブルあくび 8

かわいい 9

多分仲はいい 10

そろそろ本題に入ったほうがいいですか？ 11

前振りとりあえずどんな感じか 12

Chap. 1では・・・正常時の分布テスト対象の分布 p 0( x ) x p
( x ) が所定の閾値を下回ったら異常と判定 ※ 今回の話題のために多少意訳 p ( x ) p 0( x ) Text p. 5 13

確率密度を割り算してみよう！ 14

こんなデータを想定してみる確率密度低高 p ( x ) p 0(
x ) 15 1 2 N ✓ 20 20 ,  10 0 0 10 ◆ 1 2 N ✓ 10 10 ,  10 0 0 10 ◆ 1 5 N ✓ 12.5 12.5 ,  5 0 0 5 ◆ 1 5 N ✓ 17.5 17.5 ,  5 0 0 5 ◆ 1 5 N ✓ 15 15 ,  0.1 0 0 0.1 ◆ 1 5 N ✓ 12.5 17.5 ,  5 0 0 5 ◆ 1 5 N ✓ 17.5 12.5 ,  5 0 0 5 ◆

こんなデータを想定してみる確率密度低高 •：データ点 p ( x ) p
0( x ) サンプリングサンプリング 16

こんな振動データ的なイメージ 17 ー：X-方向加速度 ---：Y-方向加速度

こんな振動データ的なイメージー：X-方向加速度 ---：Y-方向加速度通常モード 18

こんな振動データ的なイメージ 19 高速モードー：X-方向加速度 ---：Y-方向加速度

こんな振動データ的なイメージ 20 通常？ー：X-方向加速度 ---：Y-方向加速度

こんな振動データ的なイメージ 21 高速？ー：X-方向加速度 ---：Y-方向加速度

こんな振動データ的なイメージ 22 ！？ー：X-方向加速度 ---：Y-方向加速度

こんな振動データ的なイメージ 23 アカーンー：X-方向加速度 ---：Y-方向加速度

それぞれ推定してみよう確率密度低高カーネル密度推定を使用 24

いい感じに推定できたぞじゃあ、(数値的に)割り算するよ 25

！！！！？？？？？密度比低(異常) 高(正常) 26

ヤバス全部異常でおk？ 27

そんなはずはないので密度比推定してみるよ 28

これはいいものだ密度比低(異常) 高(正常) 29

これはいいものだ密度比低(異常) 高(正常) アカーンな辺り！？な辺り 30

なかなかイケてらっしゃる今日は前ページの手法の勉強をするよ 31

密度比推定による異常検知 11.1 密度比による外れ値検出問題の定式化[1] Text p. 145 32

密度比の振る舞い a ( x ) = ln r ( x
) ただし r( x ) ⌘ p( x ) p0( x ) 異常度 (11.1) Text p. 146 33

) ただし r( x ) ⌘ p( x ) p0( x ) 異常度 (11.1) p0( x ) = (1 ↵)p( x ) + ↵˜ p( x ) 異常標本の割合を　として ↵ Text p. 146 34

) ただし r( x ) ⌘ p( x ) p0( x ) 異常度 (11.1) p0( x ) = (1 ↵)p( x ) + ↵˜ p( x ) ln(1 ↵)  a( x 0)  1 異常標本の割合を　として ↵ なんやかんやして Text p. 146 35

) ただし r( x ) ⌘ p( x ) p0( x ) 異常度 (11.1) p0( x ) = (1 ↵)p( x ) + ↵˜ p( x ) ln(1 ↵)  a( x 0)  1 異常標本の割合を　として ↵ なんやかんやして　　　　：　で近似してその値との乖離を見るそれ以外：何かしら他の基準を決める ↵ ⇡ 0 ↵ Text p. 146 36

なるほど密度比がわかれば異常度を評価できるのね 37

でも、確率密度を推定して割り算するのって現実的なの？ cf. さっきの例 38

難しい問題解かなくてもいいじゃないバプニックの原理ある問題を解くときにそれよりも一般的な問題を途中段階で解くべきではない Text p. 148 39

個別の密度がわかると・・・バプニックの原理ある問題を解くときにそれよりも一般的な問題を途中段階で解くべきではない個別の密度がわかる p ( x ) p
0( x ) Text p. 148 40

密度比がわかるバプニックの原理ある問題を解くときにそれよりも一般的な問題を途中段階で解くべきではない個別の密度がわかる密度比がわかる p ( x )
p 0( x ) r ( x ) = p ( x ) p 0( x ) Text p. 148 41

でも、密度比がわかっても・・・バプニックの原理ある問題を解くときにそれよりも一般的な問題を途中段階で解くべきではない密度比がわかる r ( x ) =
p ( x ) p 0( x ) Text p. 148 42

個別の密度はわからないバプニックの原理ある問題を解くときにそれよりも一般的な問題を途中段階で解くべきではない個別の密度がわかる密度比がわかる p ( x )
p 0( x ) r ( x ) = p ( x ) p 0( x ) Text p. 148 43

でもとりあえず今回は 44

密度比だけわかればいいじゃない！バプニックの原理ある問題を解くときにそれよりも一般的な問題を途中段階で解くべきではない個別の密度がわかる密度比がわかる p ( x )
p 0( x ) r ( x ) = p ( x ) p 0( x ) こっちがわかればおk！ ※ 個別に密度推定して割り算すると前振りみたいに大変なことになる・誤差の増幅・数値的に不安定・密度推定自体が大変 etc. Text p. 148 45

そんなわけで個別に密度を推定せず密度比を直接推定する方法を考えます 46

密度比推定による異常検知 11.2 カルバック・ライブラー密度比推定法 [1, 2, 3] Text p. 148 47

表記の準備訓練データほぼ全てが正常とみなせるテストデータ異常が入ってるかもしれない Text p. 145 48 D
= x1, . . . , xN ✓ ⇠ p( x ) ◆ D0 = x 0 1, . . . , x 0 N0 ✓ ⇠ p0( x ) ◆

まずは密度比のモデルを決めましょうとりあえず基底関数を導入して、パラメータの線形モデル r ✓ ( x ) =
b X j=1 ✓j j( x ) = ✓ > ( x ) を考えます Text p. 148 49 (11.2) ( x ) = [ 1( x ), . . . , b( x )]> ✓ = [✓1, . . . , ✓b]>

なんかいきなりよくわかんないモデルが登場したぞ！ 50

モデルの気持ちを考えよう 51 p ( x ) こんな確率密度関数から正常データが出てくるとしましょう Text p.
148

基底ベクトルの様子 52 x1 x2 x3 2( x ) 3( x
) D = { x1, x2, x3 } = { 2 . 5 , 0 , 2 . 5} が得られたとすると基底ベクトル ( x ) = [ 1( x ) , 2( x ) , 3( x )]> はこんな感じ ※ 基底関数はRBFカーネルを想定(cf. p.71) 1( x ) Text p. 148

モデルの気持ちを考えよう 53 p 0( x ) んでもって、こんな確率密度関数からテストデータが出てくるとしましょう p (
x )

“比”の役割をが担います 54 ✓ 簡単のため、テストデータが　だけに影響するとすると ✓2 x2(= 0) の近傍で、密度(のようなもの)は大体1/3くらい
になるので、　　　　　　　　とすると、モデルは↓ ✓ = [1, 1/3, 1]> r✓( x ) = ✓> ( x ) =  1 , 1 3, 1 2 4 1( x ) 2( x ) 3( x ) 3 5 Text p. 148

テストデータが密な場所は比が小さくなる 55 簡単のため、テストデータが　だけに影響するとすると ✓2 x2(= 0) の近傍で、密度(のようなもの)は大体1/3くらいになるので、　　　　　　　　とすると、モデルは↓ ✓
= [1, 1/3, 1]> r✓( x ) = ✓> ( x ) =  1 , 1 3, 1 2 4 1( x ) 2( x ) 3( x ) 3 5 テストデータで密度が高い領域の密度比が低くなる！ Text p. 148

56 ではを学習する方法を見ていきましょー ✓

学習時に考慮すべきことは何か r ✓ ( x ) = p( x )
p0( x ) r ✓ ( x )p0( x ) = p( x ) 　　　　　が •  　にできるだけ近い •  確率分布の条件を満たす p( x ) r ✓ ( x )p0( x ) ように、パラメータを決めなきゃいけない ✓ Text p. 149 57

KL div.を基準に学習しましょう Kullback-Leibler先生に登場していただきます Text p. 149 58 gKL( p||r ✓
p0 ) = Z dx p (x) ln p (x) r ✓(x) p0 (x) ⇢Z dx p (x) Z dx r ✓(x) p0 (x) = Z dx p (x) ln r ✓(x) + Z dx r ✓(x) p0 (x) + const と　　　　　　を近づけたいので、 r ✓ ( x )p0( x ) p( x )

KL div.を基準に学習しましょう Kullback-Leibler先生に登場していただきます Text p. 149 59 gKL( p||r ✓
p0 ) = Z dx p (x) ln p (x) r ✓(x) p0 (x) ⇢Z dx p (x) Z dx r ✓(x) p0 (x) = Z dx p (x) ln r ✓(x) + Z dx r ✓(x) p0 (x) + const と　　　　　　を近づけたいので、 r ✓ ( x )p0( x ) p( x )

KL div.を基準に学習しましょう Kullback-Leibler先生に登場していただきますむし 1 N N X n=1 ln
r ✓ ( xn) 1 N0 N0 X n=1 r ✓ ( x 0 n0 ) Text p. 149 60 gKL( p||r ✓ p0 ) = Z dx p (x) ln p (x) r ✓(x) p0 (x) ⇢Z dx p (x) Z dx r ✓(x) p0 (x) = Z dx p (x) ln r ✓(x) + Z dx r ✓(x) p0 (x) + const と　　　　　　を近づけたいので、 r ✓ ( x )p0( x ) p( x )

KL div.を基準に学習しましょうと　　　　　　を近づけたいので、 r ✓ ( x )p0( x )
p( x ) Kullback-Leibler先生に登場していただきますむし = 1 N N X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 ) 1 N N X n=1 ln r ✓ ( xn) 1 N0 N0 X n=1 r ✓ ( x 0 n0 ) Text p. 149 61 gKL( p||r ✓ p0 ) = Z dx p (x) ln p (x) r ✓(x) p0 (x) ⇢Z dx p (x) Z dx r ✓(x) p0 (x) = Z dx p (x) ln r ✓(x) + Z dx r ✓(x) p0 (x) + const

問題(11.5) 問題設定はこんな感じになります Text p. 150 62 min ✓ J( ✓
), J( ✓ ) = 1 N N X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 )

問題(11.5) この問題ってどう解釈できるの？期待値の表記を用いると・・・ Text p. 150 63 J(✓) = h
ln r✓iD + hr✓iD0 min ✓ J( ✓ ), J( ✓ ) = 1 N N X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 ) (11.6)

問題(11.5) 正常データ異常度最小化と解釈できます期待値の表記を用いると・・・第1項は訓練データ( ≒ 正常データ)に対する異常度の最小化としての働き Text p.
150 64 J(✓) = h ln r✓iD + hr✓iD0 min ✓ J( ✓ ), J( ✓ ) = 1 N N X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 ) (11.6)

問題(11.5) 正常データ異常度最小化と解釈できます期待値の表記を用いると・・・第1項は訓練データ( ≒ 正常データ)に対する異常度の最小化としての働き第2項は　　　という規格化制約
としての働き hr✓iD0 = 1 Text p. 150 65 J(✓) = h ln r✓iD + hr✓iD0 min ✓ J( ✓ ), J( ✓ ) = 1 N N X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 ) (11.6)

問題(11.5) 正常データ異常度最小化と解釈できます min ✓ J( ✓ ), J( ✓ )
= 1 N N X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 ) 期待値の表記を用いると・・・第1項は訓練データ( ≒ 正常データ)に対する異常度の最小化としての働き第2項は　　　という規格化制約としての働き hr✓iD0 = 1 これが本当かどうか謎です「小さくする」働きはあるかなと思いますが・・・ Text p. 150 66 J(✓) = h ln r✓iD + hr✓iD0 (11.6)

勾配法で解きましょう rJ( ✓ ) = r  1 N N
X n=1 ln r ✓ ( xn) + 1 N0 N0 X n0=1 r ✓ ( x 0 n0 ) = r  1 N N X n=1 ln ✓ > ( xn) + 1 N0 N0 X n0=1 ✓ > ( x 0 n0 ) = 1 N N X n=1 ( xn) ✓ > ( xn) + 1 N0 N0 X n0=1 ( x 0 n0 ) 問題(11.5)は凸最適化問題なので、勾配法とかで最適解が求まります適当な初期値から収束するまで以下よろしくー ✓new ✓old ⌘rJ(✓old) Text p. 150 67

ひとこと本には書いてありませんが、パラメータに関する非負制約は必要っぽい規格化に関する制約についてはよくわからんです教えてエロい人 ✓new ✓old ⌘rJ (
✓old ) ✓new max( ✓new, 0b) Text p. 151 68 ✓i 0, i = 1, . . . , b

よしこれで準備は整って 69

よしこれで準備は整ってなーーーーい 70

　　　ってなんなんだー？ 71 ( x ) よく用いられるのは RBFカーネルとのこと(SVMとかと同じですね) ( x
) = [ 1( x ), . . . , N ( x )]> ただし n(x) = exp ✓ || x xn ||2 2 h2 ◆ Text p. 151

RBFカーネル基底関数のイメージ (cf. p.52, 54) 72 Text p. 148 D =
{ x1, x2, x3 } = { 2 . 5 , 0 , 2 . 5} のとき ( x ) は↑の3点をカーネルの中心とした 3次元のベクトルになります x1 x2 x3 2( x ) 3( x ) 1( x ) (x) = 2 4 1(x) 2(x) 3(x) 3 5 = 2 6 6 6 6 6 6 4 exp ✓ (x x1) 2 2h 2 ◆ exp ✓ (x x2) 2 2h 2 ◆ exp ✓ (x x3) 2 2h 2 ◆ 3 7 7 7 7 7 7 5

　　　がわかれば具体的な計算ができます 73 ( x ) K = ⇥ ( x1),
. . . , ( xN ) ⇤> , K0 = ⇥ ( x 0 1), . . . , ( x 0 N0 ) ⇤> 勾配密度比 r ✓ ( x ) = ✓ > ( x ) ただし 1N , 1N0 : それぞれ , 次元の1を並べたベクトル N N0 “./”演算子: 要素ごとの割り算(like matlab) Text p. 151 rJ(✓) = 1 N K(1N ./(K✓)) + 1 N0 K01N0

よし今度こそ準備が整って 74

よし今度こそ準備が整ってなーーーーい 75

はどうやって決めるのさ？ 76 h カルバック・ライブラー密度比推定では交差検証法が使えます！近傍法やサポートベクトルデータ記述法では・・・ (教師ありデータがないと)CVにおける評価基準がない！カルバック・ライブラー密度比推定では・・・カルバック・ライブラーダイバージェンスを
CVの評価基準にできる！詳しくは「アルゴリズム11.1」を見てね！ Text p. 152

試してみよー 77

こんな分布から200サンプルずつ生成 p ( x ) = N(1 , 12) ー：
ー： p 0( x ) = N(0 , 22) 78

ワーオ r ⇤( x ) ˆ r ( x )
ー： ---： p ( x ) = N(1 , 12) ー：ー： p 0( x ) = N(0 , 22) 79

11.2 まとめ KLダイバージェンスの最小化で密度比が直接推定できるよ！ 80

11.2 補足: Bregmanダイバージェンス[5, 6] '( x ) 81 D'( x
|| y ) ⌘ '( x ) '( y ) h x y , r'( y )i '(y) x y r'( y )>( x y ) D'( x || y ) '(z)

11.2 補足: 一般化KLダイバージェンス 82 とおくと '( p ) = Z
d x p( x ) ln p( x ) Bregmanダイバージェンスで

11.2 補足: 一般化KLダイバージェンス D'( p || q ) = Z
d x p( x ) ln p( x ) Z d x q( x ) ln q( x ) h p q , r'( q )i = Z d x p( x ) ln p( x ) Z d x q( x ) ln q( x ) Z d x p( x ) q( x ) ln q( x ) + 1 = Z d x p( x ) ln p( x ) q( x ) Z d x p( x ) + Z d x q( x ) gKL( p || q ) ⌘ D'( p || q ) = Z d x p( x ) ln p( x ) q( x ) Z d x p( x ) + Z d x q( x ) 一般化KLダイバージェンス 83 とおくと '( p ) = Z d x p( x ) ln p( x ) Bregmanダイバージェンスで

11.2 補足: 一般化KLダイバージェンス D'( p || q ) = Z
d x p( x ) ln p( x ) Z d x q( x ) ln q( x ) h p q , r'( q )i = Z d x p( x ) ln p( x ) Z d x q( x ) ln q( x ) Z d x p( x ) q( x ) ln q( x ) + 1 = Z d x p( x ) ln p( x ) q( x ) Z d x p( x ) + Z d x q( x ) gKL( p || q ) ⌘ D'( p || q ) = Z d x p( x ) ln p( x ) q( x ) Z d x p( x ) + Z d x q( x ) 一般化KLダイバージェンス Z d x p( x ) = 1, Z d x q( x ) = 1 を満たすなら KLダイバージェンス KL( p || q ) ⌘ Dnorm ' ( p || q ) = Z d x p( x ) ln p( x ) q( x ) 84 とおくと '( p ) = Z d x p( x ) ln p( x ) Bregmanダイバージェンスで

11.2 補足: オリジナルのKLIEP(※) 文献[2]では一般化KLダイバージェンスの最小化ではなく、通常のKLダイバージェンスの制約付き最適化問題をProjected Gradient Descent[7]で解いてるようです ※
問題11.5の第二項を落とし、和が1になる制約条件を課す min ✓ N X n=1 ln r ✓ ( xn) s.t. 1 N0 N0 X n0=1 ✓ > ( x 0 n0 ) = 1 ✓ 0b 85 ※ Kullback-Leibler Importance Estimation Procedure：KL密度比推定のこと

11.2 補足: オリジナルのKLIEP 多分どっちでもいいんだと思います (最適解は変わる気がしますが) ちなみに本資料11.2の例題は本に書いてある方法に非負制約をつけたもので実装しました 86

密度比推定による異常検知 11.3 最小2乗密度比推定法[1, 2, 4] Text p. 153 87

モデルは一緒です r( x ) = p( x ) p0( x
) 密度比をってなモデルで表現するとこは一緒 88 Text p. 148 r ✓ ( x ) = ✓ > ( x )

KL div.の代わりに2乗誤差を最小化します min ✓ Z d x p( x )
ln p( x ) r ✓ ( x )p0( x ) 1 + Z d x r ✓ ( x )p0( x ) min ✓ 1 2 Z d x nr ✓ ( x ) r( x )o2 p0( x ) カルバック・ライブラー密度比推定法一般化カルバック・ライブラーダイバージェンス最小2乗密度比推定法 2乗誤差 Text p. 154 89

そんなわけで 2乗誤差をなんやかんやしていきます 90

2乗誤差の式をなんやかんやして・・・ J (✓) = 1 2 Z dx nr ✓(x)
r (x) o2 p0 (x) = 1 2 Z dx nr ✓(x) 2p0 (x) 2 r ✓(x) r (x) p0 (x) + r (x) 2p0 (x) o = 1 2 Z dx nr ✓(x) 2p0 (x) 2 r ✓(x) p (x) + const o = 1 2 Z dx✓ > (x) (x) > ✓ p0 (x) Z dx✓ > (x) p (x) + const = 1 2 ✓ > Z dx (x) (x) >p0 (x) ✓ ✓ > Z dx (x) p (x) + const Text p. 154 91

2乗誤差の式をなんやかんやして・・・ ⇡ 1 N0 N0 X n0=1 ( x 0
n0 ) ( x 0 n0 )> = ˆ G ⇡ 1 N N X n=1 ( xn) = ˆ h 標本平均で近似同じく J (✓) = 1 2 Z dx nr ✓(x) r (x) o2 p0 (x) = 1 2 Z dx nr ✓(x) 2p0 (x) 2 r ✓(x) r (x) p0 (x) + r (x) 2p0 (x) o = 1 2 Z dx nr ✓(x) 2p0 (x) 2 r ✓(x) p (x) + const o = 1 2 Z dx✓ > (x) (x) > ✓ p0 (x) Z dx✓ > (x) p (x) + const = 1 2 ✓ > Z dx (x) (x) >p0 (x) ✓ ✓ > Z dx (x) p (x) + const Text p. 154 96

問題(11.11) 問題設定はこんな感じになります min ✓  1 2 ✓> ˆ G✓
✓> ˆ h + 2 ||✓||2 Text p. 154 97 正則化項をつけます

問題(11.11) 微分して0とおくと・・・ min ✓  1 2 ✓> ˆ G✓
✓> ˆ h + 2 ||✓||2 @J0(✓) @✓ = ✓> ˆ G ˆ h > + ✓> = 0 ˆ G✓ + ✓ = ˆ h (ˆ G + IN )✓ = ˆ h 微分して0と置いてパラメータについて解くと・・・ Text p. 154 98

問題(11.11) 微分して0とおくと解析解が得られます！ min ✓  1 2 ✓> ˆ G✓
✓> ˆ h + 2 ||✓||2 @J0(✓) @✓ = ✓> ˆ G ˆ h > + ✓> = 0 ˆ G✓ + ✓ = ˆ h (ˆ G + IN )✓ = ˆ h ˆ ✓ = (ˆ G + IN ) 1 ˆ h 解析解微分して0と置いてパラメータについて解くと・・・ Text p. 154 99 (11.12)

試してみよー 100

さっきと同じデータで p ( x ) = N(1 , 12) ー：
ー： p 0( x ) = N(0 , 22) 101

ワーオ p ( x ) = N(1 , 12) ー：
ー： r ⇤( x ) ˆ r ( x ) ー： ---： p 0( x ) = N(0 , 22) 102

11.3 まとめ 2乗誤差の最小化でも密度比が直接推定できるよ！ 103

Chap. 11 まとめ -- Point1 -- 「密度比」を直接推定することで異常検知のためのモデルが作れます --
Point2 -- 密度比推定には幾つかのアプローチがあります 104

前振り再び密度比の様子と正常/異常判定について考える 105

2次元人工データ再訪 106 確率密度低高 •：データ点 p ( x )
p 0( x ) サンプリングサンプリング

密度比の様子 p ( x ) p 0( x ) 107

p ( x ) p 0( x ) 閾値を適当に決めてみたよ訓練データ(正常データ)の密度比の下側10%を
閾値にしてみたイメージ的には「危険率10%」 108

どう見ても正常・異常なものは拾えてそう p ( x ) p 0( x ) ザ・正常
ザ・異常 109

でも若干怪しいものちらほら p ( x ) p 0( x ) 誤警報
or 外れ値見逃しビミョー 110

実際に現場で使う場合はいろいろ調整が必要です 111

参考文献 1.  井手剛, 杉山将. 異常検知と変化検知. 講談社. 2015 2. 
M. Sugiyama, T. Suzuki, and T. Kanamori. Density Ratio Estimation In Machine Learning. CAMBRIDGE UNIVERSITY PRESS. 2012. 3.  M. Sugiyama, et al. Direct Importance Estimation with Model Selection and Its Application to Covariate Shift Adaptation. NIPS. 2008. 4.  T. Kanamori, et al. A Least-squares Approach to Direct Importance Estimation. JMLR, 10, 1391-1445. 2009. 5.  A. Banerjee, et al. Clustering with Bregman Divergences. JMLR 6, 1705-1749. 2005. 6.  J. Ghosh. Bregman Divergence for Data Mining Meta-Algorithms. slide. 7.  S. Boyd, and L. Vandenberghe. Convex Optimization. CAMBRIDGE UNIVERSITY PRESS. 2004. 112

ご清聴あじゅじゅしたー 113

密度比推定による異常検知

密度比推定による異常検知

More Decks by oshokawa

Featured

Transcript