Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ゼロつく2 輪読会 3.1-3.3
Search
keitaro2002
February 21, 2024
Technology
0
9
ゼロつく2 輪読会 3.1-3.3
keitaro2002
February 21, 2024
Tweet
Share
More Decks by keitaro2002
See All by keitaro2002
ゼロつく2 輪読会 3.4-3.6
keitaro2002
0
9
Other Decks in Technology
See All in Technology
開発スピードの維持向上を支える、テスト設計の 漸進的進化への取り組み / Continuous Test Design Development for Speed of Product Development
ropqa
0
180
Prisma ORMを2年運用して培ったノウハウを共有する
tockn
19
4.9k
OPENLOGI Company Profile
hr01
0
45k
「知的単純作業」を自動化する、地に足の着いた大規模言語モデル (LLM) の活用
nrryuya
8
8.1k
社内での継続的な機械学習勉強会の開催のコツ
yudai00
2
380
Shinagile 2024
kawaguti
PRO
2
110
技術力の伸ばし方を考える
khirata
0
130
PHP 9 に備えよ - 動的プロパティ、どうすればいぃ?
taisukearase
0
150
M5stackで使用できるpHセンサの開発
shinrinakamura
1
300
グイグイ系QAエンジニアでやっていくよ!
____rina____
0
720
Zero Data Loss Autonomous Recovery Service サービス概要
oracle4engineer
PRO
0
2k
個人のAWSアカウントをマルチ運用してみた
miura55
2
290
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
267
39k
Design by the Numbers
sachag
274
18k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
Why Our Code Smells
bkeepers
PRO
331
56k
Thoughts on Productivity
jonyablonski
60
3.9k
For a Future-Friendly Web
brad_frost
172
9k
Music & Morning Musume
bryan
41
5.6k
Building Adaptive Systems
keathley
32
1.9k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
221
21k
Large-scale JavaScript Application Architecture
addyosmani
504
110k
Into the Great Unknown - MozCon
thekraken
15
1.1k
Put a Button on it: Removing Barriers to Going Fast.
kastner
58
3.1k
Transcript
ゼロつく2 輪読会 Part3 3.1~3.3 2024年 2⽉22⽇
‣ これ以降の図は以下より引⽤ 斎藤 康毅 「ゼロから作るDeep Learning ❷―⾃然⾔語処理編」 はじめに
‣ 前回の復習 ‣ カウントベースから推論ベースへ ‣ word2vec ‣ 次回に向けて ⽬次
前回の復習
‣ コサイン類似度→(⾃⼰)相互情報量 PMI ‣ 値が⼤きいほど共起(⼀緒に出現)しやすい ‣ SVD(特異値分解)による次元削減 前回の復習
カウントベースから推論ベー スへ
‣ ⼤規模なコーパスを扱いきれない. ‣ SVDまで⾏うと𝑂(𝑛!)の計算コストがかかる. ‣ 学習時に全てのデータを⽤いて1回の処理で分散表現を 獲得 カウントベースの問題点
‣ 推論ベース ‣ ミニバッチで学習 推論ベースの登場
‣ 周囲の単語から「?」に⼊る単語を推測する. ‣ 単語の出現確率を学習 推論ベースの概要
‣ one-hotベクトル 単語の処理
word2vec
‣ word2vecで提案されているモデルの1つ ‣ コンテキストからターゲットを推測するNN (学習の詳細は次回) CBOW(countinuous bag-of-word)
モデルの具体例 コンテキストとしてN個の単語 →⼊⼒層はN個 CrossEntropyLoss
‣ 3つの選択肢 1. ⼊⼒側の重み(𝑊"# )だけ 2. 出⼒側の重み(𝑊$%& )だけ 3. 2つの重みを両⽅
‣ 1.⼊⼒側の重みだけが最もポピュラー 単語の分散表現
次回に向けて
‣ 使⽤するコーパス ‣ 「You say goodbye and I say hello.」
学習データの準備
コンテキストとターゲット
ベクトルに変換
one-hotベクトル