Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜

ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜

2022/02/18(金)に開催したExploratory データサイエンス勉強会#22の滋賀医科歯科大学様のご登壇資料です。

Ikuya Murasato

February 18, 2022
Tweet

More Decks by Ikuya Murasato

Other Decks in Education

Transcript

  1. Exploratory で
    データをExplore する
    〜研究⼒の可視化を⽬指して〜
    滋賀医科⼤学IR室 ⽯井真理⼦
    2022年2⽉18⽇(⾦)Exploratory勉強会
    Exploratory
    1

    View Slide

  2. 本発表の構成
    1. ⾃⼰紹介
    2. 滋賀医科⼤学(SUMS)とIR室
    3. ⼤学の予算
    4. ⽬的と課題
    5. データを探索するためのサイクル
    6. 最後に
    2

    View Slide

  3. 本発表の構成
    1. ⾃⼰紹介
    2. 滋賀医科⼤学(SUMS)とIR室
    3. ⼤学の予算
    4. ⽬的と課題
    5. データを探索するためのサイクル
    6. 最後に
    3

    View Slide

  4. 1.⾃⼰紹介
    ●2021年4⽉
    ブートキャンプ
    ●2021年5⽉
    データラングリング・トレーニング
    ●2019年10⽉以前
    教育関連企業や私⽴⼤学で勤務
    ●2019年11⽉〜現在
    滋賀医科⼤学IR室勤務
    4

    View Slide

  5. 2.滋賀医科⼤学(SUMS)について①
    滋賀県
    京都府
    ⼤阪府
    兵庫県
    国⽴⼤学法⼈滋賀医科⼤学
    5

    View Slide

  6. 2.滋賀医科⼤学(SUMS)について②
    出典︓滋賀医科⼤学統合報告書2021
    IR室は2019年4⽉設置
    6

    View Slide

  7. 2.滋賀医科⼤学(SUMS)について③
    IR室ではどんなことをしているのか
    (IR : Institutional Research)
    l 学⻑の意思決定及び各種評価に係る情報の
    収集並びに分析
    l ⼤学経営及び⼈材育成に係る総合的な
    戦略の企画⽴案における⽀援
    滋賀医科⼤学IR室規定より
    統合報告書
    Integrated Report
    7

    View Slide

  8. 本発表の構成
    1. ⾃⼰紹介
    2. 滋賀医科⼤学(SUMS)とIR室
    3. ⼤学の予算
    4. ⽬的と課題
    5. データを探索するためのサイクル
    6. 最後に
    8

    View Slide

  9. 3.⼤学の予算①
    国立大学協会, 第4期中期目標期間における国立大学法人運営費交付金の在り方に関する検討会(第6回)資料1, 文部科学省, 2021-03-11
    https://www.mext.go.jp/kaigisiryo/content/20210310-mxt_hojinka-000013351_2.pdf
    運営交付⾦
    国からの予算は
    減少傾向
    9

    View Slide

  10. 3.⼤学の予算①
    第4期中期⽬標期間における国⽴⼤学法⼈運営費交付⾦の在り⽅に関する検討会(第9回)参考資料2, ⽂部科学省, 2021-06-18
    https://www.mext.go.jp/kaigisiryo/content/20210617-mxt_hojinka-000016042_5.pdf
    運営交付⾦
    研究費が占める割合も
    減少傾向
    国⽴⼤学法⼈等(90法⼈)の経常費⽤の推移
    外部資⾦の獲得が重要
    10

    View Slide

  11. 3.⼤学の予算②
    科学研究費助成事業 全ての分野にわたり「学術研究」
    を発展させることを⽬的とする
    「競争的研究費」
    出典︓⽇本学術振興会 https://www.jsps.go.jp/j-grantsinaid/index.html(⼀部抜粋)
    科学研究費助成事業(科研費)
    採択率は全国平均を
    上回っている
    滋賀医科⼤学の現状
    滋賀医⼤は安⼼していて⼤丈夫なのか︖
    11

    View Slide

  12. 本発表の構成
    1. ⾃⼰紹介
    2. 滋賀医科⼤学(SUMS)とIR室
    3. ⼤学の予算
    4. ⽬的と課題
    5. データを探索するためのサイクル
    6. 最後に
    12

    View Slide

  13. 4.⽬的と課題
    さまざまな視点で科研費の採択率や申請率の
    現状を把握するために集計・可視化を⾏う
    13

    View Slide

  14. 4.⽬的と課題
    申請率
    採択率
    若⼿研究者
    年齢別
    所属別 職種別
    指標とカテゴリーに複数の組み合わせがある
    指標 カテゴリー






    14

    View Slide

  15. 4.⽬的と課題
    データの整理・集計に時間を取られ、⼀歩進んだ集
    計・可視化に時間が取れていない
    その結果、いつも⾒ている指標だけしか集計・可視
    化できずに、異なる視点から科研費の採択率を⾒る
    ことができていない








    エクセル集計の限界
    15

    View Slide

  16. 4.⽬的と課題 まとめ
    l 様々な視点で採択率を⾒るためには、
    データを結合したり、計算⽤の列を作ったり、
    「データの加⼯」は必須
    l データの加⼯が正しくできたのか、
    「チェック」を⾏うことも必要
    l 最終的に「集計・可視化」を⾏う
    これらの探索サイクルをまわす必要がある
    16

    View Slide

  17. 本発表の構成
    1. ⾃⼰紹介
    2. 滋賀医科⼤学(SUMS)とIR室
    3. ⼤学の予算
    4. ⽬的と課題
    5. データを探索するためのサイクル
    6. 最後に
    17

    View Slide

  18. 5.データを探索するためのサイクル
    Exploratoryで探索サイクルをまわす
    データ加⼯
    チェック
    集計・可視化
    Exploratory
    18

    View Slide

  19. 5.データを探索するためのサイクル
    ・サマリビューを確認
    ・重複を表⽰
    ・N/Aのみ表⽰
    ・集計表を作成
    ・チャートで表⽰
    20
    全教員の背景データ
    採択リスト
    申請リスト
    データ加⼯
    チェック
    集計・可視化
    採択 申請
    ・マージ/Union
    ・結合/Join

    View Slide

  20. 5.データ探索サイクル
    科研費の採択率をカテゴリー別で集計・可視化するためには、
    2つのデータを結合する必要がある
    左外部結合(Left Join)
    個⼈ID 研究者名 ⽣年⽉⽇ 所属
    AA0001 〇〇
    AA0002 △△
    AA0003 □□
    個⼈ID 採択 種⽬
    AA0001 TRUE 基盤研究(C)
    AA0002 TRUE 若⼿研究
    AA0003 TRUE 挑戦的研究(萌芽)
    個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬
    AA0001 〇〇 TRUE 基盤研究(C)
    AA0002 △△ TRUE 若⼿研究
    AA0003 □□ TRUE 挑戦的研究(萌芽)
    全教員の背景データ 採択リスト
    21
    データ加⼯

    View Slide

  21. 5.データ探索サイクル
    22
    データ加⼯

    View Slide

  22. 5.データ探索サイクル
    追加された列にオレンジ⾊の線が付く
    23
    データ加⼯

    View Slide

  23. 5.データ探索サイクル
    結合した結果、⽋損値になっていることがある
    個⼈ID 研究者名 ⽣年⽉⽇ 所属
    AA0001 〇〇
    AA0002 △△
    AA0003 □□
    個⼈ID 採択 種⽬
    AA0001 TRUE 基盤研究(C)
    AA0003 TRUE 若⼿研究
    AA0004 TRUE 挑戦的研究(萌芽)
    個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬
    AA0001 〇〇 TRUE 基盤研究(C)
    AA0002 △△
    AA0003 □□ TRUE 若⼿研究
    AA0004 〇△ TRUE 挑戦的研究(萌芽)
    全教員の背景データ 採択リスト
    結合したデータ
    24
    チェック

    View Slide

  24. 5.データ探索サイクル
    サマリビューから⽋損値の有無を確認
    25
    チェック

    View Slide

  25. 5.データ探索サイクル
    結合した結果、⾏が増えることもある
    個⼈ID 研究者名 ⽣年⽉⽇ 所属
    AA0001 〇〇
    AA0002 △△
    AA0003 □□
    個⼈ID 採択 種⽬
    AA0001 TRUE 基盤研究(C)
    AA0001 TRUE 挑戦的研究(萌芽)
    AA0003 TRUE 若⼿研究
    個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬
    AA0001 〇〇 TRUE 基盤研究(C)
    AA0001 〇〇 TRUE 挑戦的研究(萌芽)
    AA0002 △△
    AA0003 □□ TRUE 若⼿研究
    全教員の背景データ 採択リスト
    結合したデータ
    26
    チェック

    View Slide

  26. 5.データ探索サイクル
    結合前 結合後
    ステップを⾏き来することで結合前後の変化を確認できる
    27
    チェック

    View Slide

  27. 5.データ探索サイクル
    フィルタの「重複する⾏のみを残す」
    確認が終わったステップは無効化
    確認するためのステップを追加
    28
    チェック

    View Slide

  28. 5.データ探索サイクル
    同⼀⼈物が複数の科研費に申請し、採択されていることがわかった
    29
    チェック

    View Slide

  29. 5.データ探索サイクル
    簡単に集計表やグラフが作成できる
    30
    集計・可視化

    View Slide

  30. 5.データ探索サイクル
    ピンを移動して利⽤するデータを変えられる
    31
    集計・可視化

    View Slide

  31. 5.データ探索サイクル
    「科研費採択」との相関をExploreする
    32
    集計・可視化

    View Slide

  32. 5.データ探索サイクル
    Y軸:
    採択率
    X軸:年齢
    ※研究種目の「若手研究」は
    他種目より採択率が高い
    ※科研費を申請した人でフィルタ
    33
    35歳ごろまでは採択率が⾼いことがわかる(右肩上がり)
    集計・可視化

    View Slide

  33. 5.データ探索サイクル まとめ
    l データラングリングの時間を短縮できる
    l 異なった視点の分析・可視化が可能
    l 探索が簡単にできて、再現性が⾼い
    34

    View Slide

  34. 本発表の構成
    1. ⾃⼰紹介
    2. 滋賀医科⼤学(SUMS)とIR室
    3. ⼤学の予算
    4. ⽬的と課題
    5. データを探索するためのサイクル
    6. 最後に
    35

    View Slide

  35. 6.最後に
    Exploratoryで探索サイクルをまわし、データ加⼯・
    チェックの⼿順を素早く⾏い、集計・可視化
    Exploratory
    l 獲得⾦額や経年変化をみていく
    l ⼤学の今後に役⽴つデータを⾒つける
    今後も探索を続けて
    36

    View Slide

  36. ご清聴ありがとうございました
    滋賀医科⼤学IR室 ⽯井真理⼦
    2022年2⽉18⽇(⾦)Exploratory勉強会
    Exploratory

    View Slide