Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LSTM to GRU
Search
CookieBox26
June 06, 2020
300
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LSTM to GRU
CookieBox26
June 06, 2020
More Decks by CookieBox26
See All by CookieBox26
ずんだもんと雪さんとDeepSeek-R1-Zero
cookiebox26
0
1.4k
svm as a constrainted optimization
cookiebox26
0
120
最近のTransformer関連の論文から
cookiebox26
0
320
KDD2021の多変量時系列関連のタイトルいくつか
cookiebox26
0
310
固有表現抽出をドメイン外の弱いラベリングたちから学習する
cookiebox26
0
110
Speech and Language Processing 9章 RNNによる系列の処理
cookiebox26
0
2.3k
Speech and Language Processing 5章 ロジスティック回帰
cookiebox26
0
360
「統計的因果推論」勉強会 「1. 古典的問題意識」
cookiebox26
0
940
レヴィ過程の経験尤度推定の紹介
cookiebox26
0
670
Featured
See All Featured
Building AI with AI
inesmontani
PRO
1
1.1k
Music & Morning Musume
bryan
47
7.2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
A better future with KSS
kneath
240
18k
Documentation Writing (for coders)
carmenintech
77
5.4k
Claude Code のすすめ
schroneko
67
230k
We Have a Design System, Now What?
morganepeng
55
8.2k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
1
1.3k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Transcript
Uc + tanh Wc Ui + sigmoid Wi × ×
+ Uf + sigmoid Wf tanh × Uo + sigmoid Wo 入力から特徴を 読み取る 記憶を出力すべ きか制御する 特徴を記憶すべ きか制御する 記憶を忘却すべ きか制御する 出力 h 記憶 c 特徴 bo bc bi bf LSTMは https://en.wikipedia.org/wiki/Long_short-term_memory を参考にした. Output Gate Input Gate Forget Gate GRUは https://en.wikipedia.org/wiki/Gated_recurrent_unit を参考にした. LSTM を用意する。 出力 h(前) 記憶 c(前) 入力 x LSTM
Uc + tanh Wc Ui + sigmoid Wi × ×
+ Uf + sigmoid Wf 入力から特徴を 読み取る 特徴を記憶すべ きか制御する 記憶を忘却すべ きか制御する 記憶 c 記憶 c(前) 記憶 c(前) 特徴 bc bi bf LSTMは https://en.wikipedia.org/wiki/Long_short-term_memory を参考にした. Input Gate Forget Gate GRUは https://en.wikipedia.org/wiki/Gated_recurrent_unit を参考にした. 出力 h の出力を廃止し記憶 c に一本化する。これにより Output Gate の使用機会がなくなり消滅する。 前ステップの出力 h を利用していた箇所は前ステップの記憶 c を利用するように変更する。 入力 x
Uc + tanh Wc Ui + sigmoid Wi × ×
+ Uf + sigmoid Wf 入力から特徴を 読み取る 出力を特徴で更新 すべきか制御する 出力を忘却すべ きか制御する 出力 h 入力 x 出力 h(前) 特徴 bc bi bf Input Gate Forget Gate LSTMは https://en.wikipedia.org/wiki/Long_short-term_memory を参考にした. GRUは https://en.wikipedia.org/wiki/Gated_recurrent_unit を参考にした. 記憶 c を新たに出力 h とする。
Uc + tanh Wc Ui + sigmoid Wi × ×
+ 入力から特徴を 読み取る 出力を特徴で更新 すべきか制御する 出力 h 入力 x 出力 h(前) 特徴 bc bi Update Gate LSTMは https://en.wikipedia.org/wiki/Long_short-term_memory を参考にした. GRUは https://en.wikipedia.org/wiki/Gated_recurrent_unit を参考にした. 出力と記憶を統合したことにより Input Gate と Forget Gate の役割が重複してしまったため、2つの Gate を統合して Update Gate とする。
Uc + tanh Wc Ui + sigmoid Wi × ×
+ 入力から特徴を 読み取る 出力を特徴で更新 すべきか制御する 出力 h 入力 x 出力 h(前) 特徴 bc bi Update Gate LSTMは https://en.wikipedia.org/wiki/Long_short-term_memory を参考にした. GRUは https://en.wikipedia.org/wiki/Gated_recurrent_unit を参考にした. Ur + sigmoid Wr 内部状態を利用す べきか制御する br × Reset Gate 出力と記憶を統合したことにより、現時点の特徴を生成するのに常に前ステップの出力=記憶を100%利用する状態になっていた。 特徴生成に使用する出力=記憶をリセットするための機構として Reset Gate を設置する( Fully Gated Unit )。 Fully Gated Unit arXiv:1406.1078
Uc + tanh Wc × × + 入力から特徴を 読み取る 出力
h 入力 x 出力 h(前) 特徴 bc LSTMは https://en.wikipedia.org/wiki/Long_short-term_memory を参考にした. GRUは https://en.wikipedia.org/wiki/Gated_recurrent_unit を参考にした. Ur + sigmoid Wr 内部状態を忘却す べきか制御する br × Forget Gate Forget Gate (shared) Reset Gate と Upgate Gate の類似性から、この2つの Gate は統合してもよさそうである。 これらを統合して Forget Gate にする( Minimal Gated Unit ) 。 Minimal Gated Unit arXiv:1701.03452