Slide 25
Slide 25 text
Fast 𝑘𝑘NN-MT(入力を活用して推論時にコンパクトなデータストアを構築)
24
Meng+ (2022)
Yuxian Meng, Xiaoya Li, Xiayu Zheng, Fei Wu, Xiaofei Sun, Tianwei Zhang, Jiwei Li. 2022. Fast Nearest Neighbor Machine Translation.
Findings of ACL.
※ 訓練コーパス(パラレルコーパス)の単語対応(アライメント)はFastAlign (Dyer+ 2013) で自動的に求める
𝒉𝒉11
𝒉𝒉12
𝒉𝒉13 𝒉𝒉14
𝒛𝒛11
𝒛𝒛12 𝒛𝒛13
𝒛𝒛14
b c d a
A B C D
𝒉𝒉21
𝒉𝒉22
𝒉𝒉23
𝒛𝒛21
𝒛𝒛22 𝒛𝒛23
𝒛𝒛24
c d e b
B C D
𝒉𝒉31
𝒉𝒉32
𝒉𝒉33 𝒉𝒉34
𝒛𝒛31
𝒛𝒛32 𝒛𝒛33
𝒛𝒛34
a b c d
A B D E
𝒛𝒛35
e
𝒉𝒉41
𝒉𝒉42
𝒉𝒉43
𝒛𝒛41
𝒛𝒛42 𝒛𝒛43
b d e
B D E
訓練コーパス※(下側は原言語、上側は対象言語、𝒉𝒉はエンコーダの最終層、𝒛𝒛はデコーダの最終層)
A: 𝒉𝒉11 𝒛𝒛14 a
( ),
, ( )
, 𝒉𝒉31 𝒛𝒛31 a
( )
, ( )
,
B: 𝒉𝒉12 𝒛𝒛11 b
( ),
, ( )
, 𝒉𝒉21 𝒛𝒛23 e
( ),
, ( )
, 𝒉𝒉32 𝒛𝒛32 b
( ),
, ( )
, 𝒉𝒉41 𝒛𝒛41 b
( )
, ( )
,
C: 𝒉𝒉1𝟑𝟑 𝒛𝒛1𝟐𝟐 c
( ),
, ( )
, 𝒉𝒉22 𝒛𝒛21 c
( )
, ( )
,
D: 𝒉𝒉14 𝒛𝒛13 d
( ),
, ( )
, 𝒉𝒉23 𝒛𝒛22 d
( ),
, ( )
, 𝒉𝒉33 𝒛𝒛33 c
( ),
, ( )
, 𝒉𝒉42 𝒛𝒛42 d
( )
, ( )
,
E: 𝒉𝒉34 𝒛𝒛34 d
( ),
, ( ) 𝒉𝒉43 𝒛𝒛43 e
( )
, ( ) 𝒦𝒦, 𝒱𝒱 = {(𝒉𝒉𝑖𝑖
, (𝒛𝒛𝑗𝑗
, 𝑦𝑦𝑗𝑗
)}
原言語の単語毎にデータストアを構築 (キーは原言語側の表現ベクトル)
推論時に対象言語のデータストアを構築 (原言語の入力が”B C E”のとき)
B( )の近傍2件
𝒛𝒛23 e
( )
,
𝒛𝒛11 b
( )
, 𝒛𝒛1𝟐𝟐 c
( )
, 𝒛𝒛21 c
( )
, 𝒛𝒛34 d
( ) 𝒛𝒛43 e
( )
C( )の近傍2件 E( )の近傍2件
𝒉𝒉1
𝒉𝒉𝟐𝟐
𝒉𝒉𝟑𝟑