WSDM 2018 論文読み会 Hyperbolic Representation Learning for Fast and Efficient Neural Qestion Answering

Hyperbolic Representation Learning for Fast and Efficient Neural Qestion Answering
WSDM 2018 論文読み会 2018/04/14 m_nishiba paper: https://arxiv.org/pdf/1707.07847.pdf ( 資料内の図表は全て上記の論文より転載) 1

サマリー Question‑Answering のランキングや探索をシンプルなネットワークで複雑なものと同等のパフォーマンスを出す。提案するHyperQA は下記のテクニックを使わない。 feature engineering similarity
matrix matching complicated attention mechanism over‑parameterized layes HyperQA はユークリッド空間ではなく双曲空間を使う。 2

バックグラウンド解くべき問題は” 質問” と” 解答群” が与えられたときに、最も良い” 解答” を見つけること。
Q: "Which teams won top three in the World Cup?" A1: "Germany is the champion of the World Cup." A2: "THe top theree of the European CUp are Spain, Netherlands and Germany." 既存の方法では、 i. 質問と解答をRNN やCNN でembedding する（Q とA で違うネットワークを使うことが多い）。 ii. 質問と解答のembedding から相互作用のある関数でマッチングスコアを計算する。 3

アプローチユークリッド空間ではなく、双曲空間シンプルなネットワーク。90k 程度のパラメータ数。 4

双曲幾何まっすぐな空間ではなく、負の曲率を持った曲がった空間 " 与えられた直線l と、その上にない１点pに対し、pを通りlに平行な直線が2 本以上存在する" 2
点間の距離に2 点の位置が影響する。 5

モデル 6

Embedding Layer GloVe 事前学習する。HyperQA の学習時にはパラメータを更新しない。 Projection Layer タスク特有の表現を学習するために単層のニュー
ラルネットを導入する。 x = ReLU(W z + b ) Q とA で同じパラメータを使用する p p 7

Learning QA Representations y = x 単純に要素単位の和をとる。LSTM やCNN を使わない。 HyperQA
では、単位球に制限にする必要がある。 y = if ∣∣y∣∣ > 1 i ∑ i ∣∣y∣∣ y 8

Hyper Representations of QA Pairs Hyperbolic 距離関数を使う。 d(q, a) =
arcosh 1 + 2 arcosh(z) = ln(z + ) ∣∣ ⋅ ∣∣はユークリッド距離 Similarity Scoring Layer s(q, a) = w d(q, a) + b ( (1 − ∣∣q∣∣ )(1 − ∣∣a∣∣ ) 2 2 ∣∣q − a∣∣2 ) √z − 1 2 f f 9

Optimization and Learning Loss = max(0, s(q, a) + λ
− s(q, a )) Δ : 正例、λ: マージン負例のサンプリングにはmix sampling を使う。ランダムサンプリングと間違いが最大となる例勾配 ∇ = ∇ (q,a)∈Δq ∑ (q,a )∉Δ ′ q ∑ ′ q R 4 (1 − ∣∣θ ∣∣ ) t 2 2 E 10

数値検証データセット、比較対象 11

評価方法 Mean Reciprocal Rank (MRR) Mean Average Precision (MAP) Precision@1
(P@1) 計算速度パラメータの数 12

考察パフォーマンス全体的に同等の精度 or ベター計算速度はかなり改善 17

Embedding size CosineQA: hyperbolic 距離の代わりにコサイン類似度を使用 18

QA Embedding QA を上手く区別できているように見える。 19

QA Embedding 実際Question のほうがノルムが大きい 20

Word Embedding 21

結論少ないパラメータ、シンプルな構造でも同等の精度が得られた。 QA のembedding だけでなく、Word レベルのembedding でも構造を学習していることがわかった。
22

WSDM 2018 論文読み会 Hyperbolic Representation Learn...

WSDM 2018 論文読み会 Hyperbolic Representation Learning for Fast and Efficient Neural Qestion Answering

nishiba

More Decks by nishiba

Other Decks in Technology

Featured

Transcript

Hyperbolic Representation Learning for Fast and Efficient Neural Qestion Answering

サマリー Question‑Answering のランキングや探索をシンプルなネットワークで複雑なものと同等のパフォーマンスを出す。提案するHyperQA は下記のテクニックを使わない。 feature engineering similarity

バックグラウンド解くべき問題は” 質問” と” 解答群” が与えられたときに、最も良い” 解答” を見つけること。

アプローチユークリッド空間ではなく、双曲空間シンプルなネットワーク。90k 程度のパラメータ数。 4

双曲幾何まっすぐな空間ではなく、負の曲率を持った曲がった空間 " 与えられた直線l と、その上にない１点pに対し、pを通りlに平行な直線が2 本以上存在する" 2

モデル 6

Embedding Layer GloVe 事前学習する。HyperQA の学習時にはパラメータを更新しない。 Projection Layer タスク特有の表現を学習するために単層のニュー

Learning QA Representations y = x 単純に要素単位の和をとる。LSTM やCNN を使わない。 HyperQA

Hyper Representations of QA Pairs Hyperbolic 距離関数を使う。 d(q, a) =

Optimization and Learning Loss = max(0, s(q, a) + λ