ゼロつく2 輪読会 3.4-3.6

ゼロつく2 輪読会 Part4 3.4~3.6 2024年 3⽉10⽇

‣ これ以降の図は以下より引⽤斎藤康毅「ゼロから作るDeep Learning ❷―⾃然⾔語処理編」はじめに

‣ 前回の復習 ‣ CBOWモデルの実装 ‣ word2vecに関する補⾜⽬次

前回の復習

‣ カウントベース→推論ベース ‣ ミニバッチ学習 ‣ 周囲のコンテキストから出現確率を推測 ‣ one-hotベクトル処理 ‣ CBOW(Continuous
Bag-Of-Word) ‣ ⼊⼒層 = (B,N,L) (B: バッチサイズ，N: コンテキスト数，L: コーパスの⻑さ) 前回の復習

CBOWの実装

学習モデルアーキテクチャ逆伝播の様⼦ optimizer : Adam

学習 loss推移分散表現コサイン類似度

word2vecの補⾜

‣ CBOWモデルを数式で考えてみる． ‣ 損失関数 ‣ 教師ラベル𝑡! は𝑤" に対応する箇所が1でその他は0 →𝑃(𝑤" |𝑤"#$
, 𝑤"%$ )のみが残る． ‣ コーパス全体 CBOWモデルと確率

‣ ターゲットからコンテキストを推測する． ‣ 損失関数 skip-gramモデル

‣ 推論ベース ‣ 語彙に新しい単語→学習済み重みを初期値として，パラメータの再学習が可能 ‣ より複雑な単語間のパターンも捉えられる． ‣ 実際は単語の類似性に関する定量評価では優劣がつけられない
カウントベースvs推論ベース

Appendix

ソースコード概要 ch3 simple_cbow.py train.py common layers.py optimizer.py trainer.py util.py
functions.py

‣ softmax ‣ cross_entropy_error functions.py

‣ MatMul ‣ init ‣params, grads ‣x (backwardで使⽤) ‣ forward
‣paramsとxを⾏列計算 ‣xを保持 ‣ backward ‣dx,dWを計算 ‣ SoftmaxWithLoss ‣ init ‣params, grads ‣y (softmaxの出⼒) ‣t (教師ラベル) ‣ forward ‣softmax ‣cross_entropy_error ‣ backward ‣dx layers.py

‣ Adam ‣ init ‣lr (学習率) optimizer.py

‣ init ‣ fit ‣ plot trainer.py

util.py

ゼロつく2 輪読会 3.4-3.6

ゼロつく2 輪読会 3.4-3.6

keitaro2002

More Decks by keitaro2002

Other Decks in Programming

Featured

Transcript

ゼロつく2 輪読会 Part4 3.4~3.6 2024年 3⽉10⽇

‣ これ以降の図は以下より引⽤斎藤康毅「ゼロから作るDeep Learning ❷―⾃然⾔語処理編」はじめに

‣ 前回の復習 ‣ CBOWモデルの実装 ‣ word2vecに関する補⾜⽬次

前回の復習

‣ カウントベース→推論ベース ‣ ミニバッチ学習 ‣ 周囲のコンテキストから出現確率を推測 ‣ one-hotベクトル処理 ‣ CBOW(Continuous

CBOWの実装

学習モデルアーキテクチャ逆伝播の様⼦ optimizer : Adam

学習 loss推移分散表現コサイン類似度

word2vecの補⾜

‣ CBOWモデルを数式で考えてみる． ‣ 損失関数 ‣ 教師ラベル𝑡! は𝑤" に対応する箇所が1でその他は0 →𝑃(𝑤" |𝑤"#$

‣ ターゲットからコンテキストを推測する． ‣ 損失関数 skip-gramモデル

‣ 推論ベース ‣ 語彙に新しい単語→学習済み重みを初期値として，パラメータの再学習が可能 ‣ より複雑な単語間のパターンも捉えられる． ‣ 実際は単語の類似性に関する定量評価では優劣がつけられない

Appendix

ソースコード概要 ch3 simple_cbow.py train.py common layers.py optimizer.py trainer.py util.py

‣ softmax ‣ cross_entropy_error functions.py

‣ MatMul ‣ init ‣params, grads ‣x (backwardで使⽤) ‣ forward

‣ Adam ‣ init ‣lr (学習率) optimizer.py

‣ init ‣ fit ‣ plot trainer.py

util.py