Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜
Search
Ikuya Murasato
February 18, 2022
Education
0
140
ExploratoryでデータをExploreする 〜研究力の可視化を目指して〜
2022/02/18(金)に開催したExploratory データサイエンス勉強会#22の滋賀医科歯科大学様のご登壇資料です。
Ikuya Murasato
February 18, 2022
Tweet
Share
More Decks by Ikuya Murasato
See All by Ikuya Murasato
トピックモデル分析を活用した問合せ業務の効率化
ikuyam
1
170
回帰分析の活用による新商品の販売力予測
ikuyam
0
130
生存分析モデルを利用したLineのブロック要因分析
ikuyam
0
70
自動車トラブルと気象条件などの探索的データ分析
ikuyam
0
50
データサイエンス「も」使えるチェンジメーカー輩出への挑戦
ikuyam
0
300
ExploratoryとRによる全学データサイエンス教育
ikuyam
0
410
エンゲージメント向上のための人事制度改革 - 管理部門におけるExploratoryの活用
ikuyam
0
1.2k
「学ぶ」分析技術から「使う」分析技術へ - Exploratoryによるドリル演習
ikuyam
0
300
データサイエンス入門教育の現場から - 46歳新任教員2年間の苦闘
ikuyam
0
390
Other Decks in Education
See All in Education
#英語力ランキング批判:EF-EPI,TOEFLスコア,英語教育実施状況調査
terasawat
0
450
自己紹介 / who-am-i
yasulab
2
3.6k
世界の子音探訪記
jamashita
0
240
ポケモンで音象徴
jamashita
0
260
VALORS A IMPULSAR
cumclavis
PRO
0
130
アイスブレイク:自己紹介ポーカーワークショップ(KAG版)
junki
2
270
Adobe Express
matleenalaakso
1
7.2k
Ch9_-_Partie_1.pdf
bernhardsvt
0
100
2024年度春学期 統計学 第9回 確からしさを記述する ー 確率 (2024. 6. 6)
akiraasano
PRO
0
110
〜AWS初心者向け〜 ベストプラクティスから学ぶ 「AWSセキュリティの高め方」
koheiyoshikawa
0
670
10分で日本史(試案)
hidekatsu_izuno
0
620
困ったときのガイドライン / We Support You in Any Situation
yasulab
2
3.6k
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
17
8.7k
Clear Off the Table
cherdarchuk
89
320k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
189
16k
GitHub's CSS Performance
jonrohan
1026
450k
Documentation Writing (for coders)
carmenintech
63
4.2k
Principles of Awesome APIs and How to Build Them.
keavy
124
16k
Imperfection Machines: The Place of Print at Facebook
scottboms
262
13k
How to Ace a Technical Interview
jacobian
274
23k
Thoughts on Productivity
jonyablonski
64
4.1k
Become a Pro
speakerdeck
PRO
15
4.8k
GraphQLの誤解/rethinking-graphql
sonatard
59
9.6k
How to train your dragon (web standard)
notwaldorf
79
5.5k
Transcript
Exploratory で データをExplore する 〜研究⼒の可視化を⽬指して〜 滋賀医科⼤学IR室 ⽯井真理⼦ 2022年2⽉18⽇(⾦)Exploratory勉強会 Exploratory 1
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 2
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 3
1.⾃⼰紹介 •2021年4⽉ ブートキャンプ •2021年5⽉ データラングリング・トレーニング •2019年10⽉以前 教育関連企業や私⽴⼤学で勤務 •2019年11⽉〜現在 滋賀医科⼤学IR室勤務 4
2.滋賀医科⼤学(SUMS)について① 滋賀県 京都府 ⼤阪府 兵庫県 国⽴⼤学法⼈滋賀医科⼤学 5
2.滋賀医科⼤学(SUMS)について② 出典︓滋賀医科⼤学統合報告書2021 IR室は2019年4⽉設置 6
2.滋賀医科⼤学(SUMS)について③ IR室ではどんなことをしているのか (IR : Institutional Research) l 学⻑の意思決定及び各種評価に係る情報の 収集並びに分析 l
⼤学経営及び⼈材育成に係る総合的な 戦略の企画⽴案における⽀援 滋賀医科⼤学IR室規定より 統合報告書 Integrated Report 7
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 8
3.⼤学の予算① 国立大学協会, 第4期中期目標期間における国立大学法人運営費交付金の在り方に関する検討会(第6回)資料1, 文部科学省, 2021-03-11 https://www.mext.go.jp/kaigisiryo/content/20210310-mxt_hojinka-000013351_2.pdf 運営交付⾦ 国からの予算は 減少傾向 9
3.⼤学の予算① 第4期中期⽬標期間における国⽴⼤学法⼈運営費交付⾦の在り⽅に関する検討会(第9回)参考資料2, ⽂部科学省, 2021-06-18 https://www.mext.go.jp/kaigisiryo/content/20210617-mxt_hojinka-000016042_5.pdf 運営交付⾦ 研究費が占める割合も 減少傾向 国⽴⼤学法⼈等(90法⼈)の経常費⽤の推移 外部資⾦の獲得が重要
10
3.⼤学の予算② 科学研究費助成事業 全ての分野にわたり「学術研究」 を発展させることを⽬的とする 「競争的研究費」 出典︓⽇本学術振興会 https://www.jsps.go.jp/j-grantsinaid/index.html(⼀部抜粋) 科学研究費助成事業(科研費) 採択率は全国平均を 上回っている
滋賀医科⼤学の現状 滋賀医⼤は安⼼していて⼤丈夫なのか︖ 11
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 12
4.⽬的と課題 さまざまな視点で科研費の採択率や申請率の 現状を把握するために集計・可視化を⾏う 13
4.⽬的と課題 申請率 採択率 若⼿研究者 年齢別 所属別 職種別 指標とカテゴリーに複数の組み合わせがある 指標 カテゴリー
業 務 上 の 課 題 14
4.⽬的と課題 データの整理・集計に時間を取られ、⼀歩進んだ集 計・可視化に時間が取れていない その結果、いつも⾒ている指標だけしか集計・可視 化できずに、異なる視点から科研費の採択率を⾒る ことができていない 組 織 と し
て の 課 題 エクセル集計の限界 15
4.⽬的と課題 まとめ l 様々な視点で採択率を⾒るためには、 データを結合したり、計算⽤の列を作ったり、 「データの加⼯」は必須 l データの加⼯が正しくできたのか、 「チェック」を⾏うことも必要 l
最終的に「集計・可視化」を⾏う これらの探索サイクルをまわす必要がある 16
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 17
5.データを探索するためのサイクル Exploratoryで探索サイクルをまわす データ加⼯ チェック 集計・可視化 Exploratory 18
5.データを探索するためのサイクル ・サマリビューを確認 ・重複を表⽰ ・N/Aのみ表⽰ ・集計表を作成 ・チャートで表⽰ 20 全教員の背景データ 採択リスト 申請リスト
データ加⼯ チェック 集計・可視化 採択 申請 ・マージ/Union ・結合/Join
5.データ探索サイクル 科研費の採択率をカテゴリー別で集計・可視化するためには、 2つのデータを結合する必要がある 左外部結合(Left Join) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001
〇〇 AA0002 △△ AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0002 TRUE 若⼿研究 AA0003 TRUE 挑戦的研究(萌芽) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0002 △△ TRUE 若⼿研究 AA0003 □□ TRUE 挑戦的研究(萌芽) 全教員の背景データ 採択リスト 21 データ加⼯
5.データ探索サイクル 22 データ加⼯
5.データ探索サイクル 追加された列にオレンジ⾊の線が付く 23 データ加⼯
5.データ探索サイクル 結合した結果、⽋損値<NA>になっていることがある 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001 〇〇 AA0002 △△
AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0003 TRUE 若⼿研究 AA0004 TRUE 挑戦的研究(萌芽) 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0002 △△ <NA> <NA> AA0003 □□ TRUE 若⼿研究 AA0004 〇△ TRUE 挑戦的研究(萌芽) 全教員の背景データ 採択リスト 結合したデータ 24 チェック
5.データ探索サイクル サマリビューから⽋損値の有無を確認 25 チェック
5.データ探索サイクル 結合した結果、⾏が増えることもある 個⼈ID 研究者名 ⽣年⽉⽇ 所属 AA0001 〇〇 AA0002 △△
AA0003 □□ 個⼈ID 採択 種⽬ AA0001 TRUE 基盤研究(C) AA0001 TRUE 挑戦的研究(萌芽) AA0003 TRUE 若⼿研究 個⼈ID 研究者名 ⽣年⽉⽇ 所属 採択 種⽬ AA0001 〇〇 TRUE 基盤研究(C) AA0001 〇〇 TRUE 挑戦的研究(萌芽) AA0002 △△ <NA> <NA> AA0003 □□ TRUE 若⼿研究 全教員の背景データ 採択リスト 結合したデータ 26 チェック
5.データ探索サイクル 結合前 結合後 ステップを⾏き来することで結合前後の変化を確認できる 27 チェック
5.データ探索サイクル フィルタの「重複する⾏のみを残す」 確認が終わったステップは無効化 確認するためのステップを追加 28 チェック
5.データ探索サイクル 同⼀⼈物が複数の科研費に申請し、採択されていることがわかった 29 チェック
5.データ探索サイクル 簡単に集計表やグラフが作成できる 30 集計・可視化
5.データ探索サイクル ピンを移動して利⽤するデータを変えられる 31 集計・可視化
5.データ探索サイクル 「科研費採択」との相関をExploreする 32 集計・可視化
5.データ探索サイクル Y軸: 採択率 X軸:年齢 ※研究種目の「若手研究」は 他種目より採択率が高い ※科研費を申請した人でフィルタ 33 35歳ごろまでは採択率が⾼いことがわかる(右肩上がり) 集計・可視化
5.データ探索サイクル まとめ l データラングリングの時間を短縮できる l 異なった視点の分析・可視化が可能 l 探索が簡単にできて、再現性が⾼い 34
本発表の構成 1. ⾃⼰紹介 2. 滋賀医科⼤学(SUMS)とIR室 3. ⼤学の予算 4. ⽬的と課題 5.
データを探索するためのサイクル 6. 最後に 35
6.最後に Exploratoryで探索サイクルをまわし、データ加⼯・ チェックの⼿順を素早く⾏い、集計・可視化 Exploratory l 獲得⾦額や経年変化をみていく l ⼤学の今後に役⽴つデータを⾒つける 今後も探索を続けて 36
ご清聴ありがとうございました 滋賀医科⼤学IR室 ⽯井真理⼦ 2022年2⽉18⽇(⾦)Exploratory勉強会 Exploratory