Slide 18
Slide 18 text
コーパス間の類似度
3. 単語分散表現による指標
• 𝐷!
で単語分散表現を学習
→𝐷"
で再学習し、どのくらい動いたかを計算
• コーパス間の語彙や⽂脈が似ているほど
スコアが下がる(低いほど良い)
ラベル付き
新聞コーパス
ラベルなし
医療コーパス
類似度
𝐷!
𝐷"
𝑊𝑊𝑉 𝐷!
, 𝐷"
=
1
|𝑉!
|
1
𝑑
.
$
*!
.
+
,
𝑊
!
$,+ − 𝑊"
$,+ .
単語分散表現
𝑊!
単語分散表現
𝑊"
𝑊𝑊𝑉
2019/9/18 NLP/CV SoTA Survey Challenge 24