2022/02/18(金)に開催したExploratory データサイエンス勉強会#22の滋賀医科歯科大学様のご登壇資料です。
Exploratory でデータをExplore する〜研究⼒の可視化を⽬指して〜滋賀医科⼤学IR室 ⽯井真理⼦2022年2⽉18⽇(⾦)Exploratory勉強会Exploratory1
View Slide
本発表の構成1. ⾃⼰紹介2. 滋賀医科⼤学(SUMS)とIR室3. ⼤学の予算4. ⽬的と課題5. データを探索するためのサイクル6. 最後に2
本発表の構成1. ⾃⼰紹介2. 滋賀医科⼤学(SUMS)とIR室3. ⼤学の予算4. ⽬的と課題5. データを探索するためのサイクル6. 最後に3
1.⾃⼰紹介●2021年4⽉ブートキャンプ●2021年5⽉データラングリング・トレーニング●2019年10⽉以前教育関連企業や私⽴⼤学で勤務●2019年11⽉〜現在滋賀医科⼤学IR室勤務4
2.滋賀医科⼤学(SUMS)について①滋賀県京都府⼤阪府兵庫県国⽴⼤学法⼈滋賀医科⼤学5
2.滋賀医科⼤学(SUMS)について②出典︓滋賀医科⼤学統合報告書2021IR室は2019年4⽉設置6
2.滋賀医科⼤学(SUMS)について③IR室ではどんなことをしているのか(IR : Institutional Research)l 学⻑の意思決定及び各種評価に係る情報の収集並びに分析l ⼤学経営及び⼈材育成に係る総合的な戦略の企画⽴案における⽀援滋賀医科⼤学IR室規定より統合報告書Integrated Report7
本発表の構成1. ⾃⼰紹介2. 滋賀医科⼤学(SUMS)とIR室3. ⼤学の予算4. ⽬的と課題5. データを探索するためのサイクル6. 最後に8
3.⼤学の予算①国立大学協会, 第4期中期目標期間における国立大学法人運営費交付金の在り方に関する検討会(第6回)資料1, 文部科学省, 2021-03-11https://www.mext.go.jp/kaigisiryo/content/20210310-mxt_hojinka-000013351_2.pdf運営交付⾦国からの予算は減少傾向9
3.⼤学の予算①第4期中期⽬標期間における国⽴⼤学法⼈運営費交付⾦の在り⽅に関する検討会(第9回)参考資料2, ⽂部科学省, 2021-06-18https://www.mext.go.jp/kaigisiryo/content/20210617-mxt_hojinka-000016042_5.pdf運営交付⾦研究費が占める割合も減少傾向国⽴⼤学法⼈等(90法⼈)の経常費⽤の推移外部資⾦の獲得が重要10
3.⼤学の予算②科学研究費助成事業 全ての分野にわたり「学術研究」を発展させることを⽬的とする「競争的研究費」出典︓⽇本学術振興会 https://www.jsps.go.jp/j-grantsinaid/index.html(⼀部抜粋)科学研究費助成事業(科研費)採択率は全国平均を上回っている滋賀医科⼤学の現状滋賀医⼤は安⼼していて⼤丈夫なのか︖11
本発表の構成1. ⾃⼰紹介2. 滋賀医科⼤学(SUMS)とIR室3. ⼤学の予算4. ⽬的と課題5. データを探索するためのサイクル6. 最後に12
4.⽬的と課題さまざまな視点で科研費の採択率や申請率の現状を把握するために集計・可視化を⾏う13
4.⽬的と課題申請率採択率若⼿研究者年齢別所属別 職種別指標とカテゴリーに複数の組み合わせがある指標 カテゴリー業務上の課題14
4.⽬的と課題データの整理・集計に時間を取られ、⼀歩進んだ集計・可視化に時間が取れていないその結果、いつも⾒ている指標だけしか集計・可視化できずに、異なる視点から科研費の採択率を⾒ることができていない組織としての課題エクセル集計の限界15
4.⽬的と課題 まとめl 様々な視点で採択率を⾒るためには、データを結合したり、計算⽤の列を作ったり、「データの加⼯」は必須l データの加⼯が正しくできたのか、「チェック」を⾏うことも必要l 最終的に「集計・可視化」を⾏うこれらの探索サイクルをまわす必要がある16
本発表の構成1. ⾃⼰紹介2. 滋賀医科⼤学(SUMS)とIR室3. ⼤学の予算4. ⽬的と課題5. データを探索するためのサイクル6. 最後に17
5.データを探索するためのサイクルExploratoryで探索サイクルをまわすデータ加⼯チェック集計・可視化Exploratory18
5.データを探索するためのサイクル・サマリビューを確認・重複を表⽰・N/Aのみ表⽰・集計表を作成・チャートで表⽰20全教員の背景データ採択リスト申請リストデータ加⼯チェック集計・可視化採択 申請・マージ/Union・結合/Join
5.データ探索サイクル科研費の採択率をカテゴリー別で集計・可視化するためには、2つのデータを結合する必要がある左外部結合(Left Join)個⼈ID 研究者名 ⽣年⽉⽇ 所属AA0001 〇〇AA0002 △△AA0003 □□個⼈ID 採択 種⽬AA0001 TRUE 基盤研究(C)AA0002 TRUE 若⼿研究AA0003 TRUE 挑戦的研究(萌芽)個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬AA0001 〇〇 TRUE 基盤研究(C)AA0002 △△ TRUE 若⼿研究AA0003 □□ TRUE 挑戦的研究(萌芽)全教員の背景データ 採択リスト21データ加⼯
5.データ探索サイクル22データ加⼯
5.データ探索サイクル追加された列にオレンジ⾊の線が付く23データ加⼯
5.データ探索サイクル結合した結果、⽋損値になっていることがある個⼈ID 研究者名 ⽣年⽉⽇ 所属AA0001 〇〇AA0002 △△AA0003 □□個⼈ID 採択 種⽬AA0001 TRUE 基盤研究(C)AA0003 TRUE 若⼿研究AA0004 TRUE 挑戦的研究(萌芽)個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬AA0001 〇〇 TRUE 基盤研究(C)AA0002 △△ AA0003 □□ TRUE 若⼿研究AA0004 〇△ TRUE 挑戦的研究(萌芽)全教員の背景データ 採択リスト結合したデータ24チェック
5.データ探索サイクルサマリビューから⽋損値の有無を確認25チェック
5.データ探索サイクル結合した結果、⾏が増えることもある個⼈ID 研究者名 ⽣年⽉⽇ 所属AA0001 〇〇AA0002 △△AA0003 □□個⼈ID 採択 種⽬AA0001 TRUE 基盤研究(C)AA0001 TRUE 挑戦的研究(萌芽)AA0003 TRUE 若⼿研究個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬AA0001 〇〇 TRUE 基盤研究(C)AA0001 〇〇 TRUE 挑戦的研究(萌芽)AA0002 △△ AA0003 □□ TRUE 若⼿研究全教員の背景データ 採択リスト結合したデータ26チェック
5.データ探索サイクル結合前 結合後ステップを⾏き来することで結合前後の変化を確認できる27チェック
5.データ探索サイクルフィルタの「重複する⾏のみを残す」確認が終わったステップは無効化確認するためのステップを追加28チェック
5.データ探索サイクル同⼀⼈物が複数の科研費に申請し、採択されていることがわかった29チェック
5.データ探索サイクル簡単に集計表やグラフが作成できる30集計・可視化
5.データ探索サイクルピンを移動して利⽤するデータを変えられる31集計・可視化
5.データ探索サイクル「科研費採択」との相関をExploreする32集計・可視化
5.データ探索サイクルY軸:採択率X軸:年齢※研究種目の「若手研究」は他種目より採択率が高い※科研費を申請した人でフィルタ3335歳ごろまでは採択率が⾼いことがわかる(右肩上がり)集計・可視化
5.データ探索サイクル まとめl データラングリングの時間を短縮できるl 異なった視点の分析・可視化が可能l 探索が簡単にできて、再現性が⾼い34
本発表の構成1. ⾃⼰紹介2. 滋賀医科⼤学(SUMS)とIR室3. ⼤学の予算4. ⽬的と課題5. データを探索するためのサイクル6. 最後に35
6.最後にExploratoryで探索サイクルをまわし、データ加⼯・チェックの⼿順を素早く⾏い、集計・可視化Exploratoryl 獲得⾦額や経年変化をみていくl ⼤学の今後に役⽴つデータを⾒つける今後も探索を続けて36
ご清聴ありがとうございました滋賀医科⼤学IR室 ⽯井真理⼦2022年2⽉18⽇(⾦)Exploratory勉強会Exploratory