ゼロつく2 輪読会 3.1-3.3

ゼロつく2 輪読会 Part3 3.1~3.3 2024年 2⽉22⽇

‣ これ以降の図は以下より引⽤斎藤康毅「ゼロから作るDeep Learning ❷―⾃然⾔語処理編」はじめに

‣ 前回の復習 ‣ カウントベースから推論ベースへ ‣ word2vec ‣ 次回に向けて⽬次

前回の復習

‣ コサイン類似度→(⾃⼰)相互情報量 PMI ‣ 値が⼤きいほど共起(⼀緒に出現)しやすい ‣ SVD(特異値分解)による次元削減前回の復習

カウントベースから推論ベースへ

‣ ⼤規模なコーパスを扱いきれない． ‣ SVDまで⾏うと𝑂(𝑛!)の計算コストがかかる． ‣ 学習時に全てのデータを⽤いて1回の処理で分散表現を獲得カウントベースの問題点

‣ 推論ベース ‣ ミニバッチで学習推論ベースの登場

‣ 周囲の単語から「?」に⼊る単語を推測する． ‣ 単語の出現確率を学習推論ベースの概要

‣ one-hotベクトル単語の処理

word2vec

‣ word2vecで提案されているモデルの1つ ‣ コンテキストからターゲットを推測するNN (学習の詳細は次回） CBOW(countinuous bag-of-word)

モデルの具体例コンテキストとしてN個の単語 →⼊⼒層はN個 CrossEntropyLoss

‣ 3つの選択肢 1. ⼊⼒側の重み(𝑊"# )だけ 2. 出⼒側の重み(𝑊$%& )だけ 3. 2つの重みを両⽅
‣ 1.⼊⼒側の重みだけが最もポピュラー単語の分散表現

次回に向けて

‣ 使⽤するコーパス ‣ 「You say goodbye and I say hello.」
学習データの準備

コンテキストとターゲット

ベクトルに変換

one-hotベクトル

keitaro2002