【論文紹介】Detecting Causal Language Use in Science Findings / Measuring Correlation-to-Causation Exaggeration in Press Releases

1. Detecting Causal Language Use in Science Findings 2. Measuring
Correlation-to-Causation Exaggeration in Press Releases Kaito Sugimoto Aizawa Lab. M1 2021/03/28 1 / 22

紹介する論文 • EMNLP 2019 / COLING 2020 • 学術論文における argument
mining のサーベイ論文の中で発見 • 内容が一続きなのでまとめて紹介 2 / 22

どんな論文か？ • どちらの論文も、サイエンスコミュニケーションにおいて correlation (相関関係) を causation (因果関係) として報じてしまう問題を背景とした研究
3 / 22

背景 • 相関関係 ≠ 因果関係というのは有名な話 • しかしながら, 研究発表やプレスリリースにおいて, 相関関係の
発見を因果関係のように表現してしまう問題が知られていた • 特に医療の世界では, 相関関係を調べる観察研究 (observational studies) と因果関係を調べる介入研究 (intervention studies) に厳密にジャンルが分かれているにもかかわらず, しばしば相関関係の発見が因果関係の発見として取り扱われてきた • ex.「母親の肥満が子供の肥満を引き起こす」 • こうした問題は, 誤った医療判断や, 特定の人々の差別にまで繋がる • 過去の人手による研究でも, 観察研究のうちおよそ 30%もの研究がそのような誤謬を犯していると報告されている 4 / 22

背景どうしてそのような誤謬を犯してしまうのか？ • 人間はそもそも相関関係を因果関係と誤って捉えがちである（from 心理学） • 研究者/報道者は contribution を誇張したい気持ちがある
• （特にノンネイティブの）研究者/報道者が writing の訓練を受けていない • 既にある他の論文の英語表現に影響を受けがち（分かる...） 5 / 22

1 つ目の研究の要旨医療論文の各 conclusion の各文について, 相関関係を述べているか因果関係を述べているかをアノテートしたデータセットを作り, 分類器を訓練. その上で,
以下のリサーチクエスチョンに答える. 1 相関関係を調べる観察研究の論文全体において、（誤って）因果関係の用語を使っているものはどの程度あるか？ 2 そのような誤謬は近年増えているのか？減っているのか？ 3 論文の著者の国や言語的背景によってそのような誤謬の頻度の差はあるのか？ 6 / 22

コーパス作成 • ある文に対して, その文が相関関係を述べているか, 因果関係を述べているかを識別する分類器を学習したい • そのために, まずコーパスを作成する •
具体的には PubMed の論文の structured abstract の conclusion の文章（総数 3,061 文）に対してアノテーションを行う 7 / 22

コーパス作成 8 / 22

コーパス作成なお, アノテートする際にサンプルで 30 本の論文で 𝜅 係数を調べたところ 0.98 だった
→ 人間のアノテーションのズレはほとんど起こらない 9 / 22

分類器の学習 LinearSVM, BiRNN, BERT, BioBERT で比較交差検証のスコア: おおむね高いスコアだが, （人間のアノテートのズレがほとんど起こらないことを考えると）人間ほどうまく分類できていないとも言え
そう 10 / 22

分類器はなぜ correlation/causation の分類を間違えてしまうのか？ • Future work などを述べているところで因果関係っぽい表現を使っているケース • 例:
These ﬁndings pose the question: why has not the nutritional status of children improved, although the living conditions of their families have signiﬁcantly improved? • improve は結論で因果関係を述べる際にしばしば用いられるので, 分類器は causal だと誤認識する（実際はこの文は結論とは関係ないので no relationship と判定されるべき） • このほかにも, 因果関係を示す表現が文の節の中にあったり, マイナーな因果関係を示す表現が使われていたりする場合に間違える • → 分類器は表面的な単語をもとに判断してしまう 11 / 22

分類器をもとにした調査 • 2014 年位 PubMed は observational study というカテゴリを導入した
• このカテゴリに属する研究は観察研究であり, 因果関係を導くことはできないとあらかじめ分かっている • このうち, structured abstract を持つ論文で, conclusion 部分が 3 文以下のものをフィルターして, 論文 37,746 件（文章数: 72,565 文）を抽出した 12 / 22

RQ1 相関関係を調べる観察研究の論文全体において、（誤って）因果関係の用語を使っているものはどの程度あるか？ Direct causal の文しか含まない論文が 21.7%, Direct causal
の文を一部含む論文が 32.4% →手で調べた既存研究の割合とほぼ同じくらい 13 / 22

RQ2 誤って因果関係を述べている論文は近年増えているのか？減っているのか？特に強い増加・減少の傾向は見られないただし, PubMed に observational study
カテゴリが導入される前の論文のことが調べられていないのが課題 14 / 22

RQ3 国や言語的背景によって差はあるのか？言語によりばらつきありドイツ語は学術論文で強い主張をすることが多いらしい（言語学の研究で知られていた内容を裏付けている） 15 / 22

2 つ目の研究の要旨論文のプレスリリースに焦点を移す論文とそのプレスリリースのペアから成るコーパスを作成し, 前の研究と同様に分類器を訓練する. そして, 元の論文では相関関係として適切に述べられている発見が,
プレスリリースでは因果関係のように述べられてしまっているケースがどの程度あるのかを調べる. 16 / 22

コーパス作成調べる対象のプレスリリースは • EurekAlert! https://www.eurekalert.org/ • ScienceDaily https://www.sciencedaily.com/ これらのうち, doi
リンクを含む記事はすぐに元の論文を対応づけることができるまた, doi リンクを含まなくても, Elasticsearch を使うことで高い精度で元の論文と対応づけられるそうである前の研究と同様, structured abstract を持つ医療論文でフィルターする 17 / 22

コーパス作成 • 1 つ目の研究では, PubMed に observational study カテゴリが導入されたのが
2014 年であり, それ以前の研究が調べられないという問題があった • そこで, LightGBM1 を訓練して, observational study 識別器を作成した • したがって, この研究では 2014 年以前の論文についてもコーパスに含めることができている（最終的には論文-プレスリリースペアが計 16,000 程度） 1なぜ BERT などの NLP 手法を使わなかったのが不明だが, F1 score で 0.95 くらい出せるらしい 18 / 22

プレスリリースにおける correlation/causation 分類プレスリリースの場合, 見出しと最初の 2 文に結論的な内容が含まれているというヒューリスティックが妥当なので, それに従って分類する
19 / 22

結果 • 元の論文では相関関係を述べているもの（6,244 本）のうち, プレスリリースで因果関係を述べているのは 22 % (1,391 本)
• しかし, そのような誇張は減少傾向にある 20 / 22

結果 • 大学によるプレスリリースの方が, ジャーナル（出版社）によるプレスリリースよりも誇張をしがち • これは人手による先行研究の結果と一致 21 / 22

まとめ・感想 • 論文の中で相関関係/因果関係の言葉遣いを調べるという, NLP のコミュニティの中だけではなかなか生まれなさそうなアイディアで面白かった • First author
の他の論文を見ると、政治や SNS のテキストマイニングの研究を行ってきているようなので, 論文に関してもこのような独自の視点を持てるのかもしれない • （この論文が論じる範囲を超えているが...）最終的には研究成果を受け取る一般市民側もリテラシーを持っていないと, このようなサイエンスコミュニケーションの問題は解決しなそうだなという気もした • BERT でも correlation/causation 分類が 100% うまくいくわけではないのは示唆的（単に学習データやモデルの問題なのか, 本質的に機械学習アプローチでは不足している何かがあるのか...） 22 / 22

【論文紹介】Detecting Causal Language Use in Science ...

【論文紹介】Detecting Causal Language Use in Science Findings / Measuring Correlation-to-Causation Exaggeration in Press Releases

Kaito Sugimoto

More Decks by Kaito Sugimoto

Other Decks in Research

Featured

Transcript

1. Detecting Causal Language Use in Science Findings 2. Measuring

紹介する論文 • EMNLP 2019 / COLING 2020 • 学術論文における argument

どんな論文か？ • どちらの論文も、サイエンスコミュニケーションにおいて correlation (相関関係) を causation (因果関係) として報じてしまう問題を背景とした研究

背景 • 相関関係 ≠ 因果関係というのは有名な話 • しかしながら, 研究発表やプレスリリースにおいて, 相関関係の

背景どうしてそのような誤謬を犯してしまうのか？ • 人間はそもそも相関関係を因果関係と誤って捉えがちである（from 心理学） • 研究者/報道者は contribution を誇張したい気持ちがある

1 つ目の研究の要旨医療論文の各 conclusion の各文について, 相関関係を述べているか因果関係を述べているかをアノテートしたデータセットを作り, 分類器を訓練. その上で,

コーパス作成 • ある文に対して, その文が相関関係を述べているか, 因果関係を述べているかを識別する分類器を学習したい • そのために, まずコーパスを作成する •

コーパス作成 8 / 22

コーパス作成なお, アノテートする際にサンプルで 30 本の論文で 𝜅 係数を調べたところ 0.98 だった

分類器の学習 LinearSVM, BiRNN, BERT, BioBERT で比較交差検証のスコア: おおむね高いスコアだが, （人間のアノテートのズレがほとんど起こらないことを考えると）人間ほどうまく分類できていないとも言え

分類器はなぜ correlation/causation の分類を間違えてしまうのか？ • Future work などを述べているところで因果関係っぽい表現を使っているケース • 例:

分類器をもとにした調査 • 2014 年位 PubMed は observational study というカテゴリを導入した

RQ1 相関関係を調べる観察研究の論文全体において、（誤って）因果関係の用語を使っているものはどの程度あるか？ Direct causal の文しか含まない論文が 21.7%, Direct causal

RQ2 誤って因果関係を述べている論文は近年増えているのか？減っているのか？特に強い増加・減少の傾向は見られないただし, PubMed に observational study

RQ3 国や言語的背景によって差はあるのか？言語によりばらつきありドイツ語は学術論文で強い主張をすることが多いらしい（言語学の研究で知られていた内容を裏付けている） 15 / 22

2 つ目の研究の要旨論文のプレスリリースに焦点を移す論文とそのプレスリリースのペアから成るコーパスを作成し, 前の研究と同様に分類器を訓練する. そして, 元の論文では相関関係として適切に述べられている発見が,

コーパス作成調べる対象のプレスリリースは • EurekAlert! https://www.eurekalert.org/ • ScienceDaily https://www.sciencedaily.com/ これらのうち, doi

コーパス作成 • 1 つ目の研究では, PubMed に observational study カテゴリが導入されたのが

プレスリリースにおける correlation/causation 分類プレスリリースの場合, 見出しと最初の 2 文に結論的な内容が含まれているというヒューリスティックが妥当なので, それに従って分類する

結果 • 元の論文では相関関係を述べているもの（6,244 本）のうち, プレスリリースで因果関係を述べているのは 22 % (1,391 本)

結果 • 大学によるプレスリリースの方が, ジャーナル（出版社）によるプレスリリースよりも誇張をしがち • これは人手による先行研究の結果と一致 21 / 22

まとめ・感想 • 論文の中で相関関係/因果関係の言葉遣いを調べるという, NLP のコミュニティの中だけではなかなか生まれなさそうなアイディアで面白かった • First author