Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習のための 統計力学&解析力学入門
Search
Etsuji Nakai
November 14, 2017
Science
17
11k
機械学習のための 統計力学&解析力学入門
ver1.0 2017/11/14
ver1.1 2017/11/16
Etsuji Nakai
November 14, 2017
Tweet
Share
More Decks by Etsuji Nakai
See All by Etsuji Nakai
Agent Development Kit によるエージェント開発入門
enakai00
19
3k
GDG Tokyo 生成 AI 論文をわいわい読む会
enakai00
1
560
Lecture course on Microservices : Part 1
enakai00
1
3.6k
Lecture course on Microservices : Part 2
enakai00
1
3.5k
Lecture course on Microservices : Part 3
enakai00
1
3.5k
Lecture course on Microservices : Part 4
enakai00
1
3.5k
JAX / Flax 入門
enakai00
1
540
生成 AI の基礎 〜 サンプル実装で学ぶ基本原理
enakai00
7
3.9k
大規模言語モデルを支える分散学習インフラ Pathways
enakai00
3
510
Other Decks in Science
See All in Science
学術講演会中央大学学員会府中支部
tagtag
0
260
統計学入門講座 第2回スライド
techmathproject
0
130
データベース09: 実体関連モデル上の一貫性制約
trycycle
PRO
0
660
07_浮世満理子_アイディア高等学院学院長_一般社団法人全国心理業連合会代表理事_紹介資料.pdf
sip3ristex
0
460
マウス肝炎ウイルス感染の遺伝子発現へのテンソル分解の適用によるSARS-CoV-2感染関連重要ヒト遺伝子と有効な薬剤の同定
tagtag
0
110
統計的因果探索: 背景知識とデータにより因果仮説を探索する
sshimizu2006
4
890
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
200
ガウス過程回帰とベイズ最適化
nearme_tech
PRO
1
410
機械学習 - K-means & 階層的クラスタリング
trycycle
PRO
0
830
メール送信サーバの集約における透過型SMTP プロキシの定量評価 / Quantitative Evaluation of Transparent SMTP Proxy in Email Sending Server Aggregation
linyows
0
910
統計学入門講座 第4回スライド
techmathproject
0
140
地質研究者が苦労しながら運用する情報公開システムの実例
naito2000
0
190
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
52
7.6k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Docker and Python
trallard
44
3.4k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
Facilitating Awesome Meetings
lara
54
6.4k
A better future with KSS
kneath
239
17k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Designing for humans not robots
tammielis
253
25k
Side Projects
sachag
454
42k
What's in a price? How to price your products and services
michaelherold
245
12k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Transcript
機械学習のための 統計力学&解析力学入門 ver1.1 2017/11/16 Etsuji Nakai (@enakai00)
統計力学の基礎
熱力学系とは? • 多数のミクロな物質が集まった観測対象物 • ミクロな内部状態を無視して、マクロな状態のみを観測 • ミクロな内部状態は時々刻々と変化する • マクロな状態は一定と見なせる ◦
例:気体の圧力 ―― ミクロには分子が壁に衝突す る際の力で、瞬間ごとに値は異なる。マクロにはそ の平均値が観測される。
熱力学系の例 • 小正準集団(Microcanonical Emsemble) ◦ 周囲とのエネルギーのやり取りがない孤立系 ◦ ミクロな内部状態のエネルギーは一定に保たれる(エネルギー保存則) • 正準集団(Canonical
Emsemble) ◦ 温度一定の巨大な「熱浴」と接した系 ◦ 熱浴とのエネルギーのやりとりがあるため、系のエネルギーに小さなゆらぎが 生じる(「熱浴」+「系」の全エネルギーは一定)
アンサンブルとは? • 一定時間 T の間、ミクロな状態を微小な時間間隔 Δt で観測して集めた「ス ナップショット」の集合 ◦ Δt
→ 0 の極限で、無限個のスナップショットが得られる • ある物理量について、アンサンブル(に含まれる無限個の状態)に対する平 均値を計算することで、マクロな観測値が計算できる ◦ 原理的には、アンサンブルの「統計分布」を知ることで、任意の物理量の観測値 が計算できることになる
小正準集団の分布 • 小正準集団では、アンサンブルに含まれるすべての状態は同じエネルギー E を持つ ◦ エネルギー保存則より成り立つ • 同じエネルギーの個々の状態は、すべて同じ頻度で出現する ◦
解析力学における「リウビルの定理」と「エルゴード仮説」によって成り立つ ⇒ 後ほど詳しく説明
正準集団の分布 • 正準集団では、系 A におけるエネルギー E の状態の出現確率は、次式で 与えられる(正準分布/ボルツマン分布) ◦ k
: ボルツマン定数 ◦ T : 熱浴の温度 ※ 上記は、個々のミクロな状態の出現確率を表わすもので、同じエネルギーの 状態が複数ある場合は、それぞれが上記の確率で出現する
正準集団の分布(詳細計算) • 「系 A」+「熱浴 B」の全エネルギーを E とする ◦ 系 A
のエネルギーが E A の時、熱浴 B のエネルギーは E - E A ◦ システム全体がとり得る状態数は (W A , W B は、特定のエネルギーに対応する A と B の状態数) ◦ 系 A がエネルギー E A の特定の状態にある時、熱浴 B がとり得る状態数は ◦ 従って、系 A がエネルギー E A の特定の状態にある確率(割合)は
正準集団の分布(詳細計算) • 熱浴の状態数は、熱浴のエネルギーに対して指数的に変化するので(証明 は略)、対数を取ると線形近似が可能 ◦ 熱力学系のエントロピー S を次で定義して、 より、次の近似が成り立つ
◦ ここで、次式の T は、熱浴の温度に一致する(証明は略)
正準分布の応用例
二次元イジングモデル • 平面上の格子点に「スピン」が配置されている • 個々のスピンは ↑(S=1)↓(S=-1)のどちらかの 状態を取る • 隣あったスピンの間にエネルギーが生じる ◦
同じ向きなら -2J ◦ 逆向きなら +2J ◦ スピンの状態を S 1 =±1, S 2 = ±1 として、E = -2JS 1 S 2 • 外部磁場 H をかけるとすべてのスピンに一様に E = -HS のエネルギーが加わる
二次元イジングモデル • あるスピン S に注目して、周りの4つのスピンの状態を S 1 〜S 4 とすると、そのスピン
が担うエネルギーは(スピン間エネルギーは2個で分け合うとして) • この時、スピン S が上を向く確率は
二次元イジングモデル • 特に S 1 〜S 4 = +1, H
= 0 の場合、スピンが上を向く確率は、温度 T の関数として次 のように変化する。 ◦ 低温では、まわりのスピンと同じ向きになる確率が高い ◦ 高温では、スピンの向きはランダムになる(上下が等確率で出現する)
ギブスサンプリング • 個々のスピンが前述の確率分布に従う時、平面上のスピン全体の同時確率分布を 知りたい ◦ 全スピンの合計値のアンサンブル平均から、この物質の「磁化」が計算される • 次の手続きで近似的なサンプリングを実施 a. 初期状態をランダムに決める
b. 1つのスピンを選択して、前述の確率に従ってスピンの方向を決める c. この状態(すべてのスピンの状態)を1つのサンプルとして取得する d. b.〜c. の手続きをすべてのスピンについて何度も繰り返す
ギブスサンプリングの実行例 • サンプリングを長期間実施した後に、1つのサンプルを取得した結果 ◦ 温度と外部磁場によって系の振る舞いが変化することが分かる 外部磁場がない場合 外部磁場がある場合
ギブスサンプリングの実行例 • 問題 ◦ 鉄片に強い磁場をかけた状態で、熱した後に冷やすと磁石になります。 ◦ これを磁場のない状態で熱した後に冷やすと磁石でなくなります。 ◦ これらの現象を前ページのサンプリング結果を用いて説明しなさい。
機械学習への応用例
PRML 8.3.3 Illustration: Image de-noising
PRML 8.3.3 Illustration: Image de-noising http://enakai00.hatenablog.com/entry/2017/11/14/075328
解析力学とエネルギー保存則
ニュートンの運動方程式 • 例:重力 mg を受ける物体の放物運動
ニュートンの運動方程式の課題 • 直交座標系以外では表式が複雑になる ◦ 前ページの例を極座標で表示した場合(見かけがまったく異なる) • 2階の微分方程式なので時間発展を直感的に把握しにくい ◦ ある時刻の座標 x
を特定しても、次の瞬間の座標は一意に決まらない(座標の 1階微分、すなわち、その瞬間の速度にも結果が依存する)
ハミルトンの運動方程式 • 変数を2倍に増やして、同値な1階の微分方程式に変形する ◦ 下記のように置くと、上記は放物運動のニュートン方程式と等価になる • これにより、系の時間発展が1階の微分方程式で記述される ⇒ 相空間 (p,
q) の1点を決めると次の瞬間の座標が一意に決定される ← ハミルトニアン
正準変換 • 母関数 W(p, Q) を用いて変数変換すると方程式の形が不変に保たれる ◦ 下記の関係を用いて (p, q)
⇔ (P, Q) の変換を行う ◦ この時、新しい変数 (P, Q) は次の関係を満たす(証明は略)
正準変換 • 例えば、母関数 を用いて、次の変数変換を行うと、極座標が得られる。
• 具体的に計算すると・・・ ◦ この時、次の方程式は4ページ前の極座標での運動方程式に一致する 正準変換
• 直交座標系でのハミルトニアンは、対象とする系の全エネルギー(運動エネルギー +位置エネルギー)に一致する • ハミルトンの運動方程式より、ハミルトニアン H の値は( H が陽に時刻 t
に依存して いなければ)変化しないことが証明できる ⇒ 一般に、ハミルトニアン H の値をその系の「エネルギー」と定義することで、 エネルギー保存則が普遍的に成立する。 エネルギー保存則
リウビルの定理とエルゴード仮説
リウビルの定理 • 相空間 (p, q) の連結部分の各点が運動方程式に従って移動する時、連結部分の体 積は不変に保たれる(リウビルの定理) • 一次元 (p,
q) の場合で証明する ◦ 密度 ρ(p, q) で相空間に分布する点の集合の運動は、連続方程式を満たす ◦ これを用いると密度関数の時間発展は次式になる ◦ ハミルトンの運動方程式を代入すると、上記は 0 になる。つまり、相空間に分布する点は 密度を一定に保って運動するので、体積が増減することはない
エルゴード仮説 • リウビルの定理より、相空間上の(同一のエネルギーを持つ)すべての点は「平等」 と言える。つまり、特別に点があつまりやすい場所というものはなく、熱力学系にお いて、同一エネルギーのすべての点(状態)が均等に実現すると期待される • ただし、これが成り立つには、相空間上に「到達不可能な点」が存在しないことが前 提となる。熱力学系では、(十分に乱雑な)任意の初期状態から、すべての点が到達 可能であることを暗黙の前提とする ⇒
エルゴード仮説
Thank You.