Upgrade to Pro — share decks privately, control downloads, hide ads and more …

EBPのための論文の読み方

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 EBPのための論文の読み方

Evidence Based Planning (根拠の基づく立案)を行う上で「論文を読んでみる」という作業を行うことがあります.
理系ではなく,論文を読んだことも無い人が,初めて「論文を読んでみる」ときの注意点をまとめてみました.

Avatar for FSCjJh3NeB

FSCjJh3NeB

July 25, 2018
Tweet

More Decks by FSCjJh3NeB

Other Decks in Education

Transcript

  1. はじめに n 対象 u これまで定量分析系の論文を読んだ経験がない社会人 n 定量分析系の論文? u この資料の作成に当たって便宜的に,勝手に作った用語 u

    定量的な分析を主体とする論文 p ここでの「定量的な分析」は,統計的検定を想定 • 数学的な何らかの証明や,質的観点のみのケーススタディ, 哲学的な論考,などの論文は含まない • EBM※関連の論文や,実験心理学系の論文,などを想定 2 ※ EBM:Evidence Based Medicine ← 正確性よりわかりやすさ重視
  2. つまり,こんなの。 n 暗記力が高まる薬品の開発 u 暗記力を高める薬品を作った u 被験者を80人あつめて, p 40人には開発した薬 p

    40人にはただのジュース …を,飲ませた u その後,辞典の内容を暗記させ, どれだけ書き出せるかテストした u 薬品を飲んだグループは, 有意にテストの点が高かった u この薬はいいやつ。 3
  3. つまり,こんなの。 n 理解力が高まる教育法の開発 u 理解力が高まる教え方を考えた u 被験者を80人あつめて, p 40人には開発した教え方 p

    40人には従来通りの教え方 …で,授業した u その後,授業内容の理解度について, テストした u 開発した方法の授業を受けたグルー プは,有意にテストの点が高かった u この方法はいいやつ。 4
  4. つまり,こんなの。 n 政策介入効果の検証 u カエルはウサギよりカワイイとい う正しい認識を適切に広めるため, 政策介入をおこなった u ラジオ,テレビ,ネットの3つで それぞれ異なる介入を行った

    u 介入効果を検証するため,選挙人 名簿を用いた層化2段階無作為抽出 で電話による聞き取りを行った u 普段ネットをよく使う人のみ,介 入後のカエルがカワイイ派が40% 増加していた u カエルはウサギよりカワイイし, 政策介入するならネットがよい。 5
  5. 論文の種類と価値 n 前掲の区分けで行くと,「査読」の有無がポイント n 査読がある方が信頼性・価値が高い n 査読が厳しいほど信頼性・価値が高い n 査読:peer review

    u 一種の第三者評価 u 原著論文や国際会議は基本的に査読あり p 査読を通過しないと,掲載されない 8 論文の穴は どこかな〜
  6. 定量分析系論文の構造 n 中身は難解ですが,構造は単純 n 仮説 u XXXはXXXでは? u AよりBの方がよいのでは? n

    作業 u 関連する既存研究を整理 u 仮説が新手法などを提案の場 合は,ここにレシピも u 本資料の読者は読み飛ばして もOK n 検証(実験) u 仮説の検証を行う u 基本はデータを集めて比較 n 考察 u 検証の結果はどうだったか n まとめ u まとめ 11
  7. هड़͍͋·͍ࡑͰ ୁั͢Δʂ どこ・何を読むか:Step0 n 心構え u 論文を読むときは「推定有罪」の原則 p 基本,信用しない,疑ってかかる •

    きちんと査読を経た論文であっても,意外とミスはあります p 詳細が不明なときは,詳細として想定されうる 最も悪い・ダメなケースとして取り扱う 12
  8. 再現性の危機 n レシピや評価の詳細を記載するのは, 第三者の検証を担保する側面も n 近年,年間に1人の人間が読めないほどの論文が… n 成果主義や任期制と相まって論文数ゲームも過熱 n 再現性のない(内容が再現できない)論文も多数…

    u Natureの1500人調査で70%は再現性なし (2016年7月) u 心理学の論文100本中,追試で有意差アリは36% (2015年8月) u などなど 13 参考: https://junkato.jp/ja/blog/2017/07/05/artifact-review- for-replicability/ ※ 再現性の有無と,悪意の有無は別問題
  9. どこ・何を読むか:Step1 n ポイント u なにが目的で u なにをどうして u なにがわかったか? 14

    ちゃんとした論文であれば 概要にこれらの要素が 書いてある 概要だけで結論を信用してはダメ。 この時点では「これはパス」 「これは保留」の判断まで。
  10. ロジックの適切さ n バリエーションが多すぎるので割愛 16 連言錯誤 後件肯定 前件否定 選言肯定 4個概念の誤謬 媒概念不周延の誤謬

    公正世界誤謬 早まった一般化 誤った二分法 間違った類推 例外の撲滅 偏りのある標本 前後即因果の誤謬 因果関係の逆転 論点先取 曖昧語法 連続性の虚偽 多義語の誤謬 多重質問の誤謬
  11. リミテーション n 定量分析系論文は基本的に「ある条件下で…した場合, XXが成り立つ/XXになる確率が高い(…かも?)」と主張 n 「ある条件」が変わったときにも成立するかは不明 u 「ある条件」の自由度の高さ=一般化可能性 n リミテーション

    u 論文で得た結論はどういう時に通用するか,もしくは通用しないか, という適用範囲 u リミテーションがはっきりしない論文は怪しい… u 「何にでも使える」「いつでも成り立つ」はかなり不審 p こういう発明・発見は滅多にないし,検証も困難 p だからこそ,そうした理論を作れたら/見つけられたらスゴイ! 18
  12. 1問目 21 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に大学生を20人あつめて, 開発した薬を飲ませた u

    その後,計算ドリルを解かせる テストを実施した u 平均80点と高い点数だった u この薬はいいやつ。 問題点は? (少なくとも3つ)
  13. 1問目 22 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に大学生を20人あつめて, 開発した薬を飲ませた u

    その後,計算ドリルを解かせる テストを実施した u 平均80点と高い点数だった u この薬はいいやつ。 児童が対象なのに, 実験は大学生で実施 暗記力を試すのに, 計算のテストを実施 比較対象もないのに, 高いかどうかはわからない
  14. 2問目 23 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に小学生を20人あつめた u その後,薬を飲む前と後で1回ずつ

    辞書を読んで覚えている内容を 書き出すテストを実施した u 薬を飲んだ後のテストの点数は 飲む前に比べて有意に高かった u この薬はいいやつ。 問題点は? (少なくとも1つ)
  15. 2問目 24 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に小学生を20人あつめた u その後,薬を飲む前と後で1回ずつ

    辞書を読んで覚えている内容を 書き出すテストを実施した u 薬を飲んだ後のテストの点数は 飲む前に比べて有意に高かった u この薬はいいやつ。 暗記ものなのに,同じ辞書 を覚えて書き出す…だと, 2回目の方が成績が上がる 薬の効果か,学習効果か, よくわからない ABテストと呼ばれる実験デザ インです
  16. 3問目 25 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者として,ある小学校から 2クラスの協力を得て p

    1クラスには開発した薬 p もう1クラスにはただのジュース …を,飲ませた u その後,辞書を暗記して覚えている 内容を書き出すテストを実施した u 薬を飲んだクラスのテストの点数は 他方に比べて有意に高かった u この薬はいいやつ。 問題点は? (気になる点が1つ)
  17. 3問目 26 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者として,ある小学校から 2クラスの協力を得て p

    1クラスには開発した薬 p もう1クラスにはただのジュース …を,飲ませた u その後,辞書を暗記して覚えている 内容を書き出すテストを実施した u 薬を飲んだクラスのテストの点数は 他方に比べて有意に高かった u この薬はいいやつ。 もともと片方のクラスの方 が点数が高かった可能性も (バイアスの存在) 比較対照実験と呼ばれる実験デ ザインです
  18. 4問目 27 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に2万人の小学生を集め ランダムに2群に割り付けし… p

    1万人には開発した薬 p 1万人にはただのジュース …を,飲ませた u その後,辞書を暗記して覚えている 内容を書き出すテストを実施した u 薬を飲んだ群のテストの点数は 他方に比べて有意に高かった u この薬はいいやつ。 問題点は? (微妙に気になる点が1つ)
  19. 4問目 28 一般的な統計手法では, サンプル数が大きいと, わずかな差でも有意差が! もしかすると,点数の差は 100点満点で0.1点かも? ランダム化比較対照実験(RCT) と呼ばれる実験デザインです n

    暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に2万人の小学生を集め ランダムに2群に割り付けし… p 1万人には開発した薬 p 1万人にはただのジュース …を,飲ませた u その後,辞書を暗記して覚えている 内容を書き出すテストを実施した u 薬を飲んだ群のテストの点数は 他方に比べて有意に高かった u この薬はいいやつ。 (もちろんサンプルが少ないのもダメ)
  20. 5問目? 29 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に100人の小学生を集め ランダムに2群に割り付け… p

    50人には開発した薬 p 50人にはただのジュース …を,飲ませた u その後,辞書を暗記して覚えている 内容を書き出すテストを実施した u 薬を飲んだ群のテストの点数は 他方に比べて2割高く,有意差も 認められた u この薬はいいやつ。 注意点は? (?)
  21. より望ましいデザイン 31 n 暗記力が高まる薬品の開発 u 児童の暗記力を高める薬品を作った u 被験者に100人の小学生を集めて※1 ランダムに2群に割り付け… p

    50人には開発した薬 p 50人にはただのジュース …を,飲ませることにした u その後,両群とも薬・ジュースを飲む 前と後で,テスト用紙※2に記載された 単語を5分暗記して,10分後に覚えて いる内容を書き出すテストを実施した u 薬を飲む前は両群で点数に有意差は なかったが,事後では薬を飲んだ群は 他方に比べて点数が2割高く,有意差も 認められた u この薬はいいやつ。 ※2: 前後でそれぞれ問題は異なるものとする 事前 事後 薬 ジュース 点数 ※1: 群ごとの学年,性別比などは別途記載とする
  22. 誤差とバイアス 33 誤差 :大 バイアス:大 誤差 :小 バイアス:大 誤差 :小

    バイアス:小 誤差 :大 バイアス:小 実際には,誤差の程度はわかるが, バイアスの程度はわからない (現実は十字マークがない状態)
  23. バイアス n 選択バイアス u 標本を抽出する際に発生するバイアス p インターネットで被験者を募る場合, そもそもインターネットをよく利用する人で, 被験者募集のページを見るようなタイプの人しか来ない •

    20代,30代だと特殊ではないかもしれないが, 70代の応募者となると,かなり特殊なプロファイルの可能性 p 暗記力を向上させる薬の被験者を募る場合,自由応募で来る人は, そもそも暗記力に不安がある可能性 p 霞ヶ関で働く人の考える世間は,地方で契約社員として 働いている人の考える世間とは違っている可能性 35
  24. イドラ n 種族のイドラ(生物) u 人間の生物的制約から生じるバイアス n 洞窟のイドラ(個人経験) u 個人の経験から生じるバイアス n

    市場のイドラ(伝聞) u 言葉や思考から生じるバイアス n 劇場のイドラ(権威) u 権威や伝統に無批判に従うことで生じる誤り 36
  25. 因果と相関 n 因果と相関は関係するけど要注意! u 相関は因果の方向性について言及していない p ex. 歩行速度と心拍数は相関 • 歩行速度が速いと,心拍数が高くなる

    ← ただしい • 心拍数が高いと,歩行速度が速くなる ← まちがい • この例だとわかりやすいので,間違っているとわかるが, 相関から都合の良い因果を導くことはよくある 38
  26. 問題 40 n 世帯年収と子供の成績 u 子供の成績に関連しそうな指標を いろいろ調べて見た u 世帯年収と成績は相関している u

    子供の成績が上がれば, 世帯収入UPで,景気も向上!! 問題点は? (少なくとも2つ)
  27. 解答例 41 手当たり次第に比較すると, 疑似相関の可能性UP 「そうはならんやろ。」 因果の方向が違うのでは… n 世帯年収と子供の成績 u 子供の成績に関連しそうな指標を

    いろいろ調べて見た u 世帯年収と成績は相関している u 子供の成績が上がれば, 世帯収入UPで,景気も向上!! 相関はあるかもしれないが, 隠れた要因があるかも?
  28. 疑似相関 n 計算上,相関はあるが実際は無関係なこと n 例えば… u ニコラス・ケイジの映画出演数と, プールの水難事故発生件数は相関がある p ニコラス・ケイジが暇だと,水難事故は発生しない?

    p 水難事故を起こせば,ニコラスの映画が増える? u アメリカでは,商店街の総収入と, 計算機科学の博士号取得者数は相関がある p 最先端の計算機科学は商店街の活性化に直接役立つ?? p 商店街で儲かった人たちは計算機科学の博士号を取りに行く? 42 cf. 偽陽性
  29. 隠れた要因 n 世帯年収と成績は相関している u データ上は確かにそうかも…でも… u 世帯年収が高いと… p 保護者が学習の重要性をよく認識している p

    さらに学習塾に通わせるなど,教育にコストをかけられる p 上記のプロファイルが似通った層で付き合うので, 子供も勉強するのが当たり前と認識している u …と言った確率が上がって,成績が上がるのかも? p つまり,本当は保護者の学習の重要性の認識が最重要で, それが世帯年収と相関していたのかも?? • 「景気が良くなって世帯年収が上がれば,成績UP!」にはならない 43
  30. さらに勉強するために n 大野木,中沢:心理学マニュアル 研究法レッスン,北大路書房,2002 http://www.kitaohji.com/books/2264_7.html n 数理社会学会:社会の見方、測り方―計量社会学への招待,勁草書房,2006 http://www.keisoshobo.co.jp/book/b26175.html n メルツォフ:クリティカルシンキング

    研究論文篇: 心理学と関連領域,北大路書房,2005 http://www.kitaohji.com/books/2459_3.html n 山田,村井:よくわかる心理統計(やわらかアカデミズム・わかるシリーズ),ミネルヴァ書房,2004 http://www.minervashobo.co.jp/book/b48724.html n アメリカ心理学会:APA論文作成マニュアル 第2版,医学書院,2011 http://www.igaku-shoin.co.jp/bookDetail.do?book=81317 n エヴェラ:政治学のリサーチ・メソッド,勁草書房,2009 http://www.keisoshobo.co.jp/book/b35050.html n S.B Hulley, et al.:医学的研究のデザイン 第4版 - 研究の質を高める疫学的アプローチ -, メディカルサイエンスインターナショナル,2014 https://www.medsi.co.jp/books/products/detail.php?product_id=3400 44
  31. 演習 n 政策介入効果の検証 u カエルはウサギよりカワイイという 正しい認識を適切に広めるため, 政策介入をおこなった u ラジオ,テレビ,ネットの3つで それぞれ異なる介入を行った

    u 介入効果を検証するため,選挙人名 簿を用いた層化2段階無作為抽出で 電話による聞き取りを行った u 普段ネットをよく使う人のみ,介入 後のカエルがカワイイ派が40%増 加していた u カエルはウサギよりカワイイし, 政策介入するならネットがよい。 45 大小様々なレベルで 様々な問題のある内容です 問題を列挙,整理し, 修正案を考えましょう ※ こんな論文が採録される可能性はほぼゼロです J
  32. 演習 n 実際の論文も読んでみましょう。 u MOOCにおける英語・日本語字幕の学習効果 DOI https://doi.org/10.24458/jaems.23.1_1 u 模擬授業を取り入れた教科教育法における受講者のICT活 用指導力の分析

    DOI https://doi.org/10.24458/jaems.22.2_21 u 初等中等教育におけるeラーニング活用教育モデルの構築 と検証 DOI https://doi.org/10.14926/jsise.29.76 u eラーニング・対面講義・グループワークに対する学習者 の認知と成績との関連性 DOI https://doi.org/10.14926/jsise.28.247 46 ※ J-Stage で 適当に選んだものです
  33. 責任者はどこか… n 論文の内容に関しては当然著者 u 明らかに大きなミスがあるのに査読を通っていれば,査読者にも 少しは責任がある…かも。 n 論文の内容を採用するか,採用して何に使うか, 採用した結果どうなったか,は採用側の責任 u

    誤った論文の主張を採用してしまい,好ましくない結果が起きた… u この場合,第1責任者は基本的に採用した側に p データがねつ造されたものだったりした場合だけは例外 47
  34. データは真実を語るか? n 当然,語らないときもある u 測定対象や粒度など“もと”が間違っていたら当然ダメ u データは正しくても,読み取りを間違っていたらダメ …などなど n 数値データが無いからエビデンスにならない!

    …ということも,当然ない u 十分データが取れないこと,検証のしようがないこと, まだ誰も考えてないこと,なども,世の中には沢山あったりする u エスノメソドロジーなど,質的分析も当然大事 n 結局,“信じるか信じないかはあなた次第” u データがある方が「より合理性が高そう」だし, 検証/議論の可能性は高そう 48 ← この辺りは社会学の先生とかに聞いてみよう
  35. 実社会におけるRCTのむつかしさ n “社会現象”はそもそも統制することが困難 u 「XXという手法が上手くいった!」 p 景気動向がよかったからじゃないの? p XXX国のXXXX地域だったからじゃないの? p

    数年前にXXXという政策を導入していたからじゃないの? n 社会は基本的に不可逆 u 「XXXはダメだったか,今度はYYYYを試してみるか」 p XXXによって既に,YYYYには耐えられない社会状況になっている可能性 p XXXの失敗経験により,社会が次の実験を受容しない可能性 n 倫理の問題も… u 「学力がすごく上がるかもしれないXXXを試したい!」 p A学校にはXXX,B学校は従来手法…もし,XXXが効果がある場合, B学校の人は機会損失,もしXXXが悪影響ならA学校の人が機会損失 49 RCTが何にでも適用可能・すべき…なわけではない,特に実社会問題には適用困難
  36. 説明原理と設計原理 n 説明原理(仮説的構成概念?) u こう考えたら,説明・理解できる/しやすいよね。的な? n 設計原理 u こうやったら,これこれが出来るよ。というレシピ的な? n

    理解をするための枠組と,作るための枠組みは,独立かも u 理解するために行った研究の論文は,直接は設計に活かせない… と,いうようなことも u 論文の方向性がどちらなのかを考えてみることも大事かも? 50
  37. 免責&License n 免責 u 内容その他について,完全無保証です n License u クリップアートや,一部の画像 p

    別に著者が存在しますので,改変等の際には, それぞれのライセンスに準じてご利用ください p クリップアートのライセンス • http://www.chojugiga.com/terms/ • http://icooon-mono.com/license/ u その他の部分(文字部分のほとんど) p 著作権の放棄はしませんが,再配布,改変,配信等ご自由に! 51