制限ボルツマンマシンの話 / Introduction of RBM

1 19 制限ボルツマンマシンの話慶應義塾大学理工学部物理情報工学科渡辺宙志 2024年5月2日研究室ミーティング

2 19 制限ボルツマンマシンとは制限ボルツマンマシン(Restricted Boltzmann Machine, RBM) とはボルツマンマシンの一種ボルツマンマシンとはイジング模型(Ising
Model)の一種 (※ベルヌーイ-ベルヌーイ型の場合) RBMを理解するには、イジング模型を理解しなければならない

3 19 イジング模型 • 格子の各点にスピン(小さな磁石)がある • スピンは「上」と「下」の状態がある • 隣り合うスピンをつなぐ線をボンドと呼ぶボンドの両側の
スピンの向き同じ逆エネルギー −𝐽 𝐽 𝐽 > 0ならスピンは揃いたがる(強磁性的) 𝐽 < 0ならスピンは逆向きを好む(反強磁性)

4 19 イジング模型格子の上の全てのボンドについてエネルギーの和を取り、この系の全エネルギーとするこのような模型をイジング模型(Ising Model)と呼び、磁性体の簡単なモデルになっている以下、強磁性 (𝐽
> 0)の場合を考える 𝐸 = −2𝐽 + 2𝐽 = 0

5 19 イジング模型 𝑖番目のスピンの状態を𝜎𝑖 とする 𝜎𝑖 の値は1(上向き)か-1(下向き)のいずれか −𝐽 𝐽 𝜎𝑖
= 1 𝜎𝑗 = 1 𝜎𝑖 = 1 𝜎𝑗 = −1 両方まとめて−𝐽𝜎𝑖 𝜎𝑗 と書ける

6 19 イジング模型全系のエネルギーは以下のように書ける 𝐻 = −𝐽 ෍ 𝑖,𝑗 𝜎𝑖
𝜎𝑗 系の全てのボンドについて和をとるという意味全系のエネルギーを与える量をハミルトニアンとよぶ

7 19 ボルツマン重み系の状態に通し番号をつけ、𝑖番目の状態のエネルギーを𝐸𝑖 とする状態𝑖 エネルギー 𝐸𝑖 = 4𝐽
𝑤𝑖 = exp(−𝛽𝐸𝑖 ) ボルツマン定数 𝛽 = 1/𝑘𝐵 𝑇 逆温度 𝑘𝐵 各状態の出現確率がボルツマン重みに比例する

8 19 イジング模型からボルツマンマシンへイジング模型を「スイッチを押したら、状態がボルツマン重みの確率に比例して出現するマシン」だと思うことにする = = イジング模型のスピンを電球の配列と考え、スピン下向きを「電気オフ」、スピン上向きを「電気オン」と対応させる

9 19 イジング模型からボルツマンマシンへ 𝐸 = −4J 𝐸 = 0 𝑤
= exp(4𝛽𝐽) 𝑤 = 1 > 左のパターンの方が出現確率が高い

10 19 イジング模型からボルツマンマシンへスピンによって電光掲示板のようにパターンを作ることができるイジングマシンはスピン間相互作用から出現パターンを予想していた逆に、所望の出現パターンを持つようなスピン間相互作用を作れないか？ボルツマンマシン

11 19 ボルツマンマシンスピン間に適当にボンドを繋いでおくボンドにはスピン間相互作用𝐽𝑖𝑗 を与える各スピンには局所磁場ℎ𝑖 を与える 𝐻 =
− ෍ 𝑖,𝑗 𝐽𝑖𝑗 𝜎𝑖 𝜎𝑗 + ෍ 𝑖 ℎ𝑖 𝜎𝑖 状態はボルツマン重みに従って出現させる

12 19 ボルツマンマシン所望のパターン 1/3 2/3 上記の確率を実現するような重みと局所磁場を求めたい 𝐻 = −
෍ 𝑖,𝑗 𝐽𝑖𝑗 𝜎𝑖 𝜎𝑗 + ෍ 𝑖 ℎ𝑖 𝜎𝑖 一般には極めて難しい

13 19 制限ボルツマンマシン • スピン間に適当にボンドを繋いでおく • ボンドにはスピン間相互作用𝐽𝑖𝑗 を与える • 各スピンには局所磁場ℎ𝑖
を与える • スピンを2つのグループに分け、同じグループ間にはスピン間相互作用を持たせない隠れ層可視層この制限により、CD法(Contrastive divergence method)と言う効率的な学習アルゴリズムが利用可能に(「制限」のメリット) G. E. Hinton, Neural Comput. 14, 1771–1800 (2002)

14 19 制限ボルツマンマシン隠れ層隠れ層可視層可視層スイッチを押すと全てのランプが重みに従って確率的に光るが
見えるのは可視層のランプのみ

15 19 制限ボルツマンマシン所望のパターン 1/3 2/3 隠れ層可視層 RBM 可視層の出現パターンが所望のパターンに一致するように重みを決める
その際、隠れ層の状態は問わない RBMの学習

16 19 制限ボルツマンマシン RBMの学習大量のデータを暗記させる学習済みRBMができること聞くたびに覚えたものからランダムに一つ返す

17 19 RBMの用途ボルツマンマシンはパターンを記憶できる →覚えていないパターンが来たらわかる(異常検知) →パターンの一部を乱されてもわかる(ノイズ修正) 制限ボルツマンマシンは情報を圧縮できる → 可視層に入力された情報を、一度隠れ層に圧縮して保存し、また可視層に再現できる

18 19 RBMの情報圧縮 1. 可視層にパターン入力 2. 可視層のパターンから隠れ層のパターン再現 3. 隠れ層のパターンから
可視層のパターン再現

19 19 まとめ • ボルツマンマシンはイジング模型の一種イジング模型：相互作用から出現パターンを推定ボルツマンマシン：出現パターンから相互作用を決定 • ボルツマンマシンはパターンを記憶する •
ノイズ修正や異常検知に使える • 制限ボルツマンマシンは、情報を圧縮する • 可視層に比べて隠れ層の数が少ない • 隠れ層は、入力の特徴量ベクトルとみなせる • 制限ボルツマンマシンは構造が単純であるため、「どこにどのような情報が蓄積されたか」の解析ができる可能性がある

制限ボルツマンマシンの話 / Introduction of RBM

制限ボルツマンマシンの話 / Introduction of RBM

kaityo256 PRO

More Decks by kaityo256

Other Decks in Education

Featured

Transcript

1 19 制限ボルツマンマシンの話慶應義塾大学理工学部物理情報工学科渡辺宙志 2024年5月2日研究室ミーティング

2 19 制限ボルツマンマシンとは制限ボルツマンマシン(Restricted Boltzmann Machine, RBM) とはボルツマンマシンの一種ボルツマンマシンとはイジング模型(Ising

3 19 イジング模型 • 格子の各点にスピン(小さな磁石)がある • スピンは「上」と「下」の状態がある • 隣り合うスピンをつなぐ線をボンドと呼ぶボンドの両側の

4 19 イジング模型格子の上の全てのボンドについてエネルギーの和を取り、この系の全エネルギーとするこのような模型をイジング模型(Ising Model)と呼び、磁性体の簡単なモデルになっている以下、強磁性 (𝐽

5 19 イジング模型 𝑖番目のスピンの状態を𝜎𝑖 とする 𝜎𝑖 の値は1(上向き)か-1(下向き)のいずれか −𝐽 𝐽 𝜎𝑖

6 19 イジング模型全系のエネルギーは以下のように書ける 𝐻 = −𝐽 ෍ 𝑖,𝑗 𝜎𝑖

7 19 ボルツマン重み系の状態に通し番号をつけ、𝑖番目の状態のエネルギーを𝐸𝑖 とする状態𝑖 エネルギー 𝐸𝑖 = 4𝐽

9 19 イジング模型からボルツマンマシンへ 𝐸 = −4J 𝐸 = 0 𝑤

11 19 ボルツマンマシンスピン間に適当にボンドを繋いでおくボンドにはスピン間相互作用𝐽𝑖𝑗 を与える各スピンには局所磁場ℎ𝑖 を与える 𝐻 =

12 19 ボルツマンマシン所望のパターン 1/3 2/3 上記の確率を実現するような重みと局所磁場を求めたい 𝐻 = −

13 19 制限ボルツマンマシン • スピン間に適当にボンドを繋いでおく • ボンドにはスピン間相互作用𝐽𝑖𝑗 を与える • 各スピンには局所磁場ℎ𝑖

14 19 制限ボルツマンマシン隠れ層隠れ層可視層可視層スイッチを押すと全てのランプが重みに従って確率的に光るが

15 19 制限ボルツマンマシン所望のパターン 1/3 2/3 隠れ層可視層 RBM 可視層の出現パターンが所望のパターンに一致するように重みを決める

16 19 制限ボルツマンマシン RBMの学習大量のデータを暗記させる学習済みRBMができること聞くたびに覚えたものからランダムに一つ返す

18 19 RBMの情報圧縮 1. 可視層にパターン入力 2. 可視層のパターンから隠れ層のパターン再現 3. 隠れ層のパターンから

19 19 まとめ • ボルツマンマシンはイジング模型の一種イジング模型：相互作用から出現パターンを推定ボルツマンマシン：出現パターンから相互作用を決定 • ボルツマンマシンはパターンを記憶する •