Slide 6
Slide 6 text
スコアリング
6
n 𝑠!"#
(𝑞, 𝑑): Coil-tokのスコア。完全一致したtokenの内、内積が最大のもの。
l 𝑠!"#
𝑞, 𝑑 = ∑$!∈$∩'
max
'"($!
(𝒗)
$*
𝒗+
')
n 𝑠$%&&
(𝑞, 𝑑): Coil-fullのスコア。𝑠!"#
(𝑞, 𝑑)とCLS-token由来のベクトルの内積を足したもの。
l 𝑠,-..
𝑞, 𝑑 = 𝑠!"#
𝑞, 𝑑 + 𝒗/.0
$ *
𝒗/.0
'
n 各ベクトルは、線形変換を通じて次元を小さくする
l 𝑣)
$ = 𝑾!"#𝐿𝑀 𝑞, 𝑖 + 𝒃!"#, 𝑣+
' = 𝑾!"#𝐿𝑀 𝑞, 𝑖 + 𝒃!"#, 𝑣/.0
$ = 𝑾/.0𝐿𝑀 𝑞, 𝐶𝐿𝑆 + 𝒃/.0 , 𝑣/.0
' = 𝑾/.0𝐿𝑀 𝑑, 𝐶𝐿𝑆 + 𝒃/.0
𝑞: クエリ, 𝑞!: クエリのi-th token
𝑑: 文書, 𝑑": 文書のj-th token
𝑞 ∩ 𝑑: クエリと文書で一致するtoken
𝒗
!
#: 𝑞!
由来のベクトル, 𝒗"
$: 𝑑"
由来のベクトル
𝐿𝑀(𝑞, 𝑖): 𝑞!
をBERTでencodesしたベクトル
𝐿𝑀(𝑑, 𝑗): 𝑑"
をBERTでencodesしたベクトル