ACL2020 Question & Answering

Question＆Answering NLPaper challenge 日坂幸次 (koji)

Question＆Answering どんなタスクか文字通り、質問から回答を推論するタスク。入力質問文：現在のアメリカの大統領は？出力回答：トランプ大統領

ベンチマーク Stanford Question Answering Dataset（SQuaD）等入力質問文：現在のアメリカの大統領は？＋短文：
アメリカ合衆国大統領（アメリカがっしゅうこくだいとうりょう、英語: President of the United States of America、略称: POTUS）は、アメリカ合衆国の国家元首であり行政府の長たる大統領。 4年ごとのアメリカ合衆国大統領選挙（以下「大統領選挙」）によって選出される。歴代大統領は歴代アメリカ合衆国大統領の一覧を参照のこと。現職は2017年1月20日より第45代のドナルド・トランプが在任。出力回答：ドナルド・トランプ短文の中から答えを抽出 Question＆Answering 色々な入力と出力タイプ

ベンチマーク Google's Natural Questions 入力質問文：現在のアメリカの大統領は？＋関連するWikipediaページ出力１
短文形式回答：ドナルド・トランプ出力２長文形式回答：現職は2017年1月20日より第45代のドナルド・トランプが在任。 Question＆Answering 色々な入力と出力タイプ

マルチホップQ&A 入力質問文：鉄は、水と酸素にさらされると表面が何色になりますか。？文章１：鉄は錆びると、表面がオレンジになります。文章２：鉄は酸素と水の存在下で錆びます。出力
回答：オレンジ色になります。複数の推論が必要 Question＆Answering 色々な入力と出力タイプ

Question＆Answering 色々な入力と出力タイプ算数問題入力質問文：青い鳥が３羽います。赤い鳥が５羽います。鳥は全部で何話ですか。出力回答：３＋５＝８

Question＆Answering 色々な入力と出力タイプ診療カルテに基づく質問と回答入力質問文：この患者さんはBMIが異常だったことはありますか？短文： 96年8月31日ホモグラフトによる上行大動脈根置換
術瞼下垂体手術を行いました。血行動態は安定しており、良好な経過をたどっています。身体検査。 BMI：33.4 肥満、ハイリスク。脈拍：60、呼吸数。18 出力回答： BMI：33.4 肥満、ハイリスク

Question＆Answering 色々な入力と出力タイプテキスト、ゲノム配列、タンパク質構造からタンパク質相互作用があるか判定入力テキスト：メガリンとキュービリン：多機能性内分泌細胞受容体PROTEIN1 とPROTEIN2は、構造的に異なる2つの内分泌細胞受容体が相互に作用して機能を発揮する。タンパク質構造：ゲノム配列：
出力タンパク質相互作用有り

どんな論文があったか • RikiNet 「Google's Natural Questions」向けモデル ⇒質問文とWikipediaの文章を一緒に学習させ高精度化

どんな論文があったか • Graph2Tree 算数問題を解くモデル ⇒グラフニューラルネットと２分木を使うことで算数問題を論理的に解く。

どんな論文があったか • ゲノム配列、タンパク質構造、テキストからタンパク質相互作用を判定 ⇒複数の入力データを解析させる、ディープマルチモーダル

どんな論文があったか • 診療の質問と回答のデータセット（emrQA）の検証 ⇒医療データに対する考察や、 BERTやDocReader等を使った性能比較

どんな論文があったか • 論理を使ったデータのかさ増しと一貫性の学習 ⇒データオーグメンテーション（データ増幅）

感想論理的な思考への取り組み複数の情報を利用したマルチモーダルデータ増幅などが新しい傾向かなと思いました。

強い研究者、機関特にここがというのは、無い印象でした。国別は、私が見た論文の中では、アメリカ３中国２インド１韓国１

Appendix

論文名人組織名 Amalgamation of protein sequence, structure and textual
information for improving protein-protein interaction identification Pratik Dutta, Sriparna Saha Department of Computer Science & Engineering Indian Institute of Technology Patna Clinical Reading Comprehension: A Thorough Analysis of the emrQA Dataset Xiang Yue Bernal Jimenez Gutierrez The Ohio State University Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings Vikas Yadav, Steven Bethard, Mihai Surdeanu University of Arizona, Tucson, AZ, USA Graph-to-Tree Learning for Solving Math Word Problems Jipeng Zhang1,2,∗ , Lei Wang2,∗ , Roy Ka-Wei Lee3 , Yi Bin1 , Yan Wang4 , Jie Shao1,5,#, Ee-Peng Lim2 1Center for Future Media, University of Electronic Science and Technology of China 2School of Information Systems, Singapore Management University 3Department of Computer Science, University of Saskatchewan 4Tencent AI Lab 5Sichuan Artificial Intelligence Research Institute Contextualized Sparse Representations for Real-Time Open-Domain Question Answering Jinhyuk Lee1 Minjoon Seo2,3 Hannaneh Hajishirzi2,4 Jaewoo Kang Korea University1 University of Washington2 Clova AI, NAVER3 Allen Institute for AI4 RikiNet: Reading Wikipedia Pages for Natural Question Answering Dayiheng Liu♠† Yeyun Gong† Jie Fu♦ Yu Yan† Jiusheng Chen♥Daxin Jiang‡ Jiancheng Lv♠ Nan Duan† College of Computer Science, Sichuan University †Microsoft Research Asia ♦ Mila ‡Microsoft Search Technology Center Asia ♥Microsoft AI and Research [email protected] DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering Qingqing Cao, Harsh Trivedi, Aruna Balasubramanian, Niranjan Balasubramanian Department of Computer Science Stony Brook University Stony Brook, NY 11794, USA

RikiNet「Google's Natural Questions」向けモデル新しいベンチマーク「Natural Questions」に特化した読解モデル「Natural Questions」は、質問文と短文のペアでな
く、質問文と関連する Wikipediaページ全体のデータセット。答えの箇所（short answer)だけでなく、答えがどの段落(long answer)にあるかも答えなければないない。

新しいベンチマーク「Natural Questions」に特化した読解モデル「Natural Questions」は、質問文と短文のペアでなく、質問文と関連する Wikipediaページ全体のデータセット。
答えの箇所（short answer)だけでなく、答えがどの段落 (long answer)にあるかも答えなければないない。 RikiNet「Google's Natural Questions」向けモデル

▪ Dynamic Paragraph Dual-Attention Reader (DPDA) 図の左ドキュメントと質問の表現を取得。 ▪ Multi-level
Cascaded Answer Predictor 図の右 Short answer とlong answer と、答え方（long,short,null,yes,no) の予測を行う。（「ノーベル賞の由来は」など、short answer では答えられない回答もあるため。） RikiNet「Google's Natural Questions」向けモデル

RikiNet「Google's Natural Questions」向けモデル

Graph2Tree 算数問題を解くモデルグラフニューラルネットのエンコーダーと、ツリーベースのデコーダを用いて、数学文章問題のタスク精度向上問題例：クラスで生徒を組織して登山を行った。女子生徒は4つのグループに分かれ、各グループには15人の生徒がいた。男子生徒は全部で76名でした。
先週は何人の生徒が登山に参加していましたか？ Graph2Tree：15 ∗ 4 + 76 = 136 https://github.com/2003pro/Graph2Tree.git

Graph2Tree 算数問題を解くモデル

ゲノム配列、タンパク質構造、テキストからタンパク質相互作用を判定タンパク質間相互作用について、テキストデータだけでなく、3次元タンパク質構造とゲノム配列をデータに加え、かつ、ディープマルチモーダルアーキテクチャを実装することで、既存のSOTAを超えた。

ゲノム配列、タンパク質構造、テキストからタンパク質相互作用を判定

診療の質問と回答のデータセット（emrQA）の検証臨床ノートに基づくQ&A用大規模データセット emrQAと臨床読解(CliniRC)タスクの詳細な分析

定性分析の結果、 (i)emrQAの回答は不完全であることが多く、 (ii)emrQAの問題は領域知識を使わずに回答できることが多いことがわかった。定量的な実験では、 (iii)サンプル数の少ないサブセット（5%～20%）を使用した場合、全データセットで学習したモデルと比較して、ほぼ同等の性能が得られること。(DocReader) (iv)この性能は人間の専門家の性能に近いこと。 (v)BERTモデルは最高性能のベースモデル(DocReader)に勝てないこと、などの驚くべき結果が得られました。 https://github.com/xiangyue9607/CliniRC
診療の質問と回答のデータセット（emrQA）の検証

⚫ ロジックを使ったデータ増幅と、一貫性に関する正則化をすることで、Q&Aタスクに関するRoBERTa の精度を向上論理を使ったデータのかさ増しと一貫性の学習

教師なし学習のための、固有表現抽出からのテンプレを使った、質問文の生成。抽出した固有表現から、テンプレを使った疑問文を作成し、それを学習させる。 Obama announced ⇒ who announced
以前の教師なしモデルと比較して約14%の相対的な改善。

質問と回答だけでなく、関係する内容も印を付けて学習させ精度向上 ⚫ 質問に関係する文脈に印をつけ、回答とその文脈を一緒に学習させることで、読解のタスクの精度を向上させる。

途中の証拠を探し、複数の推論が必要な質問への回答精度の向上 ⚫ 教師なし学習のアライメントベースの反復検索器(AIR)を用いて、証拠を探し、複数の推論が必要なマルチホップQ&Aタスクの性能を向上させ
る。

Enhancing Answer Boundary Detection for Multilingual MachineReading Comprehension ⚫ (1)質問やパッセージを他言語に翻訳し、言語間の質問とパッセージ
のペアを構築する混合MRCタスクと、 ⚫ (2)ウェブから収集した知識フレーズを利用した言語にとらわれない知識マスキングタスクの補助タスクで、 ⚫ 豊富なソース言語（英語など）からの学習データを活用して、低リソース言語での性能を向上

Contextualized Sparse Representations forReal- Time Open-Domain Question Answering ⚫ スパース表現(SPARC)を用いて
各フレーズの埋め込み表現の精度を上げて、フレーズ検索問題の精度向上。ひいては、高速な Q&Aタスクに適用できる。

Crossing Variational Autoencoders for Answer Retrieval ⚫ 質問から回答、回答から質問を生成させることで、回答検索の精度を向上。SQuadの回答検索で、最新モデルを超える。

DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering TransformerベースのQAモデルでは、すべての層で入力全体の自己
注意（すなわち、問題と入力通路の両方）を使用しているため、時間がかかり、メモリを多く消費することになります。そのため、下位層では、質問と本文を分けて処理することで高速化。

A Corpus for Large-Scale Phonetic Typology ⚫ 音韻類型論のための初の大規模コーパス ⚫
VoxClamantis V1.0

ACL2020 Question & Answering

ACL2020 Question & Answering

HisakaKoji

Other Decks in Programming

Featured

Transcript

Question＆Answering NLPaper challenge 日坂幸次 (koji)

Question＆Answering どんなタスクか文字通り、質問から回答を推論するタスク。入力質問文：現在のアメリカの大統領は？出力回答：トランプ大統領

ベンチマーク Stanford Question Answering Dataset（SQuaD）等入力質問文：現在のアメリカの大統領は？＋短文：

ベンチマーク Google's Natural Questions 入力質問文：現在のアメリカの大統領は？＋関連するWikipediaページ出力１

マルチホップQ&A 入力質問文：鉄は、水と酸素にさらされると表面が何色になりますか。？文章１：鉄は錆びると、表面がオレンジになります。文章２：鉄は酸素と水の存在下で錆びます。出力

Question＆Answering 色々な入力と出力タイプ算数問題入力質問文：青い鳥が３羽います。赤い鳥が５羽います。鳥は全部で何話ですか。出力回答：３＋５＝８

Question＆Answering 色々な入力と出力タイプ診療カルテに基づく質問と回答入力質問文：この患者さんはBMIが異常だったことはありますか？短文： 96年8月31日ホモグラフトによる上行大動脈根置換

どんな論文があったか • RikiNet 「Google's Natural Questions」向けモデル ⇒質問文とWikipediaの文章を一緒に学習させ高精度化

どんな論文があったか • Graph2Tree 算数問題を解くモデル ⇒グラフニューラルネットと２分木を使うことで算数問題を論理的に解く。

どんな論文があったか • ゲノム配列、タンパク質構造、テキストからタンパク質相互作用を判定 ⇒複数の入力データを解析させる、ディープマルチモーダル

どんな論文があったか • 診療の質問と回答のデータセット（emrQA）の検証 ⇒医療データに対する考察や、 BERTやDocReader等を使った性能比較

どんな論文があったか • 論理を使ったデータのかさ増しと一貫性の学習 ⇒データオーグメンテーション（データ増幅）

感想論理的な思考への取り組み複数の情報を利用したマルチモーダルデータ増幅などが新しい傾向かなと思いました。

強い研究者、機関特にここがというのは、無い印象でした。国別は、私が見た論文の中では、アメリカ３中国２インド１韓国１

Appendix

論文名人組織名 Amalgamation of protein sequence, structure and textual

RikiNet「Google's Natural Questions」向けモデル新しいベンチマーク「Natural Questions」に特化した読解モデル「Natural Questions」は、質問文と短文のペアでな

新しいベンチマーク「Natural Questions」に特化した読解モデル「Natural Questions」は、質問文と短文のペアでなく、質問文と関連する Wikipediaページ全体のデータセット。

▪ Dynamic Paragraph Dual-Attention Reader (DPDA) 図の左ドキュメントと質問の表現を取得。 ▪ Multi-level

RikiNet「Google's Natural Questions」向けモデル

Graph2Tree 算数問題を解くモデル

Graph2Tree 算数問題を解くモデル

ゲノム配列、タンパク質構造、テキストからタンパク質相互作用を判定

診療の質問と回答のデータセット（emrQA）の検証臨床ノートに基づくQ&A用大規模データセット emrQAと臨床読解(CliniRC)タスクの詳細な分析

⚫ ロジックを使ったデータ増幅と、一貫性に関する正則化をすることで、Q&Aタスクに関するRoBERTa の精度を向上論理を使ったデータのかさ増しと一貫性の学習

教師なし学習のための、固有表現抽出からのテンプレを使った、質問文の生成。抽出した固有表現から、テンプレを使った疑問文を作成し、それを学習させる。 Obama announced ⇒ who announced

質問と回答だけでなく、関係する内容も印を付けて学習させ精度向上 ⚫ 質問に関係する文脈に印をつけ、回答とその文脈を一緒に学習させることで、読解のタスクの精度を向上させる。

途中の証拠を探し、複数の推論が必要な質問への回答精度の向上 ⚫ 教師なし学習のアライメントベースの反復検索器(AIR)を用いて、証拠を探し、複数の推論が必要なマルチホップQ&Aタスクの性能を向上させ

Enhancing Answer Boundary Detection for Multilingual MachineReading Comprehension ⚫ (1)質問やパッセージを他言語に翻訳し、言語間の質問とパッセージ

Contextualized Sparse Representations forReal- Time Open-Domain Question Answering ⚫ スパース表現(SPARC)を用いて

Crossing Variational Autoencoders for Answer Retrieval ⚫ 質問から回答、回答から質問を生成させることで、回答検索の精度を向上。SQuadの回答検索で、最新モデルを超える。

DeFormer: Decomposing Pre-trained Transformers for Faster Question Answering TransformerベースのQAモデルでは、すべての層で入力全体の自己

A Corpus for Large-Scale Phonetic Typology ⚫ 音韻類型論のための初の大規模コーパス ⚫