$30 off During Our Annual Pro Sale. View Details »

IRではデータ収集がどのように実施・認識されてきたのか

 IRではデータ収集がどのように実施・認識されてきたのか

IRにおけるデータ収集の重要性やその実態が多くのIR担当者・研究者によって論じられてきたが、データ収集に伴う困難や課題を抱えたまま現在に至る。本稿では過去のデータ収集活動に関する資料・文献に対する簡易レビューを通じて、データ収集活動の手段とデータの特長、その困難・課題と対応について整理した。レビューの結果を踏まえ、今後のデータ収集活動の困難・課題の解決に寄与するために、データ品質の保証についてデータライフサイクルの中で論じる必要性を考察し、データ品質の保証を含めたデータマネジメントの枠組みの参照を提言した。

gmoriki | 森木銀河

November 18, 2023
Tweet

More Decks by gmoriki | 森木銀河

Other Decks in Research

Transcript

  1. IRではデータ収集が
    どのように実施・認識されてきたのか
    2023年11月18日
    九州大学IR室 学術推進専門員
    森木 銀河
    第12回大学情報・機関調査研究集会

    View Slide

  2. 問いと概要
    1
    IR担当者・研究者によってデータ収集活動が
    どのように実施・認識されてきたのか
    Q
    従来のデータ収集活動を整理し、
    今後のIRに寄与する考察および提言を行う
    A
    簡易レビューをの結果に基づき、
    データマネジメントの枠組みの導入を提案
    今後、活用の可能性を検討する

    View Slide

  3. 2
    背景と方法
    IRにおけるデータ収集活動の重要性と課題に対する認識
    調査(簡易レビュー)の対象とねらい
    データ収集はIRにおける基本原理(山田,2020)の一要素であり、
    その重要性や課題(山田,2007;柳浦,2011)が認識されてきた
    データ収集活動の課題(大学評価コンソーシアム,2013)
    課題・困難の解決のために
    対症療法的ではなく
    根幹治療的(今井,2020)なアプローチが必要
    今後のIRに対する考察・展望を与えるために、
    データ収集活動の観点と特長を抽出し、整理することがねらい
    2013年から2023年までのIRのデータ収集活動に関する
    国内の資料・文献※
    を対象に簡易レビューを実施した
    データ収集活動を
    データ収集の手段、収集するデータの特長、困難・課題の観点から整理
    • データを集めようと思っても集まらない
    • 集まっても使えない
    • 精度があまり高くない
    ※MJIR、大学評価コンソーシアムの文献・資料の他、過去の十年の学会誌等の「IRに関する特集」を対象とし、
    データ収集活動に関する資料・文献をレビュー対象としました。

    View Slide

  4. 3
    データ収集活動の特長
    ◼ データ収集活動の手段
    ◼ 収集するデータの特長
    組織的要素
    技術的要素
    簡易レビュー結果
    組織内のポリシーや文化、体制に関する要素
    使用する技術やツール、システムに関する要素
    データ内容の種別
    データ品質
    IRの目的や意図によって多様
    一般的に低いことが指摘されている
    大学評価コンソーシアム(2013)
    • データ収集の目的とデータ定義を明確にしよう
    • 執行部の理解を得て、協力してもらおう
    • 各部局との連携を強化して協力してもらおう
    吉田(2014)
    • IRを用いて、問題を内発的に発見するサイクル
    にもっていくことが課題
    • IR推進室に、全てを丸投げするような状態にな
    らないように進めていくことが必要である
    浅野(2016)
    • 特定のテーマに沿ってデータを集めて管理し、
    容易に検索・抽出する仕組み
    • 各大学の実情に即してデータを
    「まずは活用することから始めること」が推奨
    • 事例:高田ら(2015),利光(2018),村瀬ら
    (2021)
    • 山田(2013)「財務、施設、卒業生、学生を含む教
    学など多岐にわたって」いる
    • 一部調査では教学データが多い傾向(私大連,2018)
    • 研究IRが「経営IRや教学IRと同じ組織の意思決定
    に資する活動を行う部門」(山田,2020)として台頭
    • 「綺麗なデータ」を扱える機会がほとんど無い
    (藤原ら,2019)
    • 事務の担当部署が「そもそもIRなどの分析や活用
    を前提としたデータ管理になっていない」(今井
    ら,2020)
    ※ 簡易レビューでは「データ形式」を対象外とした

    View Slide

  5. 4
    データ収集活動の困難・課題と対処
    ◼ アクセス率の低さ
    ◼ データ品質の低さ
    簡易レビュー結果
    実態
    IRのデータ収集に関するアンケート結果から
    アクセス率の低さ・偏りが明らかにされてきた
    実態
    一般的に低いことが指摘されている
    • 私大連(2018)「大学の各部署が各データを管理
    しており、そのデータ形式も異なり、データベー
    スへの IR 組織のアクセスが課題であるとしてい
    る大学が多い。この傾向は、大学の規模、地域に
    よらず顕著である。」
    • 浅野ら(2018)「入手したい(分析の必要やリク
    エストがある)のに,入手出来てないデータがあ
    る」
    対処
    規約の制定等の組織的要素
    • 「IR組織の目的や機能を個々の大学構成員が認識
    する必要」性(私大連,2018)
    • 規程やガイドライン策定の重要性の指摘、
    具体的方法
    対処
    データ収集活動以前および以降において
    実施すべき取り組みが報告
    • 業務システム導入時におけるFAIRデータ原則に
    基づくデータスキームの検査の提言(森ら,2019)
    • 「業務プロセスの中で情報がいつどのように入
    力・確定されていくのかを調査し、データ蓄積と
    流通の仕組みを改善」する取り組み
    (今井ら,2021)
    • データを「分析可能な形で「速やかに」準備する
    こと」・「将来に備えて整理すること」を含む
    「データマネジメント」が定義・使用
    (藤原,2021)

    View Slide

  6. 5
    データ収集活動の困難・課題と対処
    ◼ アクセス率の低さ
    ◼ データ品質の低さ
    簡易レビュー結果
    実態
    IRのデータ収集に関するアンケート結果から
    アクセス率の低さ・偏りが明らかにされてきた
    実態
    一般的に低いことが指摘されている
    • 私大連(2018)「大学の各部署が各データを管理
    しており、そのデータ形式も異なり、データベー
    スへの IR 組織のアクセスが課題であるとしてい
    る大学が多い。この傾向は、大学の規模、地域に
    よらず顕著である。」
    • 浅野ら(2018)「入手したい(分析の必要やリク
    エストがある)のに,入手出来てないデータがあ
    る」
    対処
    規約の制定等の組織的要素
    • 「IR組織の目的や機能を個々の大学構成員が認識
    する必要」性(私大連,2018)
    • 規程やガイドライン策定の重要性の指摘、
    具体的方法
    対処
    データ収集活動以前および以降において
    実施すべき取り組みが報告
    • 業務システム導入時におけるFAIRデータ原則に
    基づくデータスキームの検査の提言(森ら,2019)
    • 「業務プロセスの中で情報がいつどのように入
    力・確定されていくのかを調査し、データ蓄積と
    流通の仕組みを改善」する取り組み
    (今井ら,2021)
    • データを「分析可能な形で「速やかに」準備する
    こと」・「将来に備えて整理すること」を含む
    「データマネジメント」が定義・使用
    (藤原,2021)
    データ品質の保証について考察

    View Slide

  7. 6
    簡易レビュー結果:データ収集活動の概念図
    データ収集 データ前処理 データ分析
    データ提供
    データ収集活動(組織的要素+技術的要素)
    IRとの連携可能性
    …情報流通の改善
    分析可能性
    …データ前処理の実施
    アクセス率が低い
    データの品質が低い
    データ品質の観点① データ品質の観点②
    組織的要素 技術的要素
    困難・課題
    考察
    ◼ データ品質の困難・課題の位置づけ
    👌データの品質をデータ収集活動の前・後に保証/向上する取り組みが報告されている
    🧐データライフサイクルの各段階におけるデータ品質を一貫して論じれば、
    データ収集活動におけるデータ品質が中長期的に保証されるのではないか
    ⇒データ収集活動における対症療法的アプローチの見直し

    View Slide

  8. 7
    提案:データマネジメントの枠組みの導入 提案
    データと情報という資産の価値を提供し、管理し、守り、高めるために、それらのライ
    フサイクルを通して計画、方針、スケジュール、手順などを開発、実施、監督すること
    ⇒広範かつ抽象的な枠組みの一部を、IRに導入・活用できるのか?できないのか?
    データマネジメントの知識体系(Aikenのピラミッド)
    データ品質
    ⚫ 「データ品質」の保証はデータガバナ
    ンス、メタデータ、データアーキテク
    チャと密接に関連している
    ⚫ データ収集時の「一時的な回避策や目
    に見えない修正作業のコスト」
    (DAMA International,2018)を
    軽減するための取り組みになる
    ⚫ データ活用のためには
    それを⽀える「良いデータ」と
    「良いデータ環境」が必要(角田,2023)
    データ品質を中長期的に保証するために、
    データマネジメントの知識体系を
    IRに導入・活用することを提案
    (DAMA International,2018)

    View Slide

  9. 8
    今後の展望
     文献調査を通じたデータ収集・分析
    ⇒データ品質・データインテグリティの保証に関する文献調査を実施
    一般企業や官公庁におけるデータ品質を保証するための取り組みや、
    先行して議論が進んでいる「研究データマネジメント」との関係を整理する
    データマネジメントに関する言説の多くは一般企業向けの内容であり、
    大学の組織情報を扱うIRへの導入が最適とは限らない
     IR担当者への半構造化インタビュー調査によるデータ収集・分析
    ⇒実際のデータ収集活動やデータ品質を保証するための取り組みをヒアリング
    現場のIR担当者のデータ品質に対する認識が
    先行研究や、データマネジメントの知的体系上の最適解と乖離している可能性がある
    データ品質に対するIR担当者の認識を加味し、
    IRにおけるデータマネジメントの概念的枠組みを形成する

    View Slide

  10. ご清聴ありがとうございました
    9
    IR担当者・研究者によってデータ収集活動が
    どのように実施・認識されてきたのか
    データ収集活動の手段:組織的要素をベースに、技術的要素が実情に応じて必要
    データの特長:近年では研究データも参照され、多様であるが、その品質は低い
    データ品質の保証についてデータライフ
    サイクルの中で論じる必要性を考察し、
    データ品質の保証を含めたデータマネジ
    メントの枠組みの導入を提案
    困難と課題の認識:アクセス率の低さ・データ品質の低さ
    今後、データマネジメントの知識的体系を
    IRに活用できるか否かを検討する
    今後のIRに寄与する
    考察および提言を行う
    本研究は大学行政管理学会「若手研究奨励」の助成を受けたものです。

    View Slide

  11. 補足資料
    10

    View Slide

  12. 11
    参考:IRとデータマネジメント
    既にIR担当者向け研修等においてデータマネジメントが言及されてきた
    本研究のデータマネジメントは、
    従来のデータマネジメント(データ品質を保証するためのデータ前処理)を含めた、
    より広範な枠組みを想定して論じる
    考察
    • 「データマネジメントの必要性と実践」(藤原,2017)
    • 「IRオフィスの設計とデータ分析 “データ”を”情報”に変換し、組織に新たな価値を増やす」
    (山本,2018)
    • 「IR(Institutional Research)におけるデータマネジメント」(藤原,2020)
    • 「IR担当者にデータマネジメントのスキルが必要な理由」 (藤原,2020)
    • 「IR活動におけるデータマネジメントの実践 ~データを深く理解するために~」(藤原,2021)
    • IR業務の展開-大学職員とデータマネジメント-(山本,2022)
    データを
    「分析可能な形で「速やかに」準備すること」
    「将来に備えて整理すること」(藤原,2021)
    言及の例
    定義の例
    Data Wranglingをはじめとする
    データ前処理に注力した定義

    View Slide

  13. 12
    主要参考文献
    [1] 山田 礼子,"日本におけるIRの動向:経営IR,教学IRから研究IRの誕生と推移",統計数理,第68巻第2号,
    pp.197-208, 2020.
    [2] 今井 匠太朗,”データ収集の仕組み”, 大学IR標準ガイドブック インスティテューショナル・リサーチのノウハウと
    実践,第4章,pp.127-135,2022
    [3] 森 雅生, 大石 哲也,” 大学IR情報の流通における質保証について”,第8回大学情報・機関調査研究集会,pp.110-
    113,2019
    [4] 大学評価コンソーシアム,” データ収集作業のガイドライン―効率的・効果的な評価作業のためのデータ収集の課題
    と対応(平成25年2月12日版)”,2013
    [5] 浅野 茂,”データベースの構築とIRの課題”,高等教育研究,19巻,pp.49-66,2016
    [6] 利光 哲哉,” 岐阜大学における戦略的統合データベース開発”,情報の科学と技術,68巻3号,pp.111-118,2018
    [7] 山田 礼子,”大学ガバナンスを⽀援するIR ―その基本原理とは”,大学時報,No.350,pp.32-37,2013
    [8] 久保 琢也,平井 克之,"研究IRにおける科研費分析の効率化を目指したWebアプリケーションの開発",大学評価
    とIR,第13号,pp. 3-12,2021
    [9] 一般社団法人日本私立大学連盟 大学IR機能促進検討プロジェクト,”これまでのIR これからのIR 課題と提言”,2018
    [10] 藤原 宏司, 浅野 茂, 白石 哲也, 鈴木 達哉, 山本 幸一,” IR履修証明プログラムの開発について”,大学評価とIR,第
    10号,pp.3-15,2019
    [11] 今井 匠太朗, 森 雅生, 冨樫 勝彦,“学内データインフラ整備にむけた業務改善の取り組み― Ranabaseを使った業
    務フローの可視化 ―, 第9回大学情報・機関調査研究集会,pp.148-153,2020
    [12] 浅野 茂, 白石 哲也, 藤原 宏司, 山本 鉱, 山本 幸一,“次のフェイズに向けたIRのTips~学内データの有効活用に必
    要なこと~”, 大学評価・IR担当者集会分科会3,2018
    [13] 塚本 浩太,”IRオフィス機能のルール”, 大学IR標準ガイドブック インスティテューショナル・リサーチのノウハウ
    と実践,第3章,pp.98-101,2022
    [14] 今井 匠太朗, 森 雅生,” IR推進のためのDXの取り組み”, 第10回大学情報・機関調査研究集会 論文集,pp.72-
    77,2021
    [15] 藤原宏司,” IR活動におけるデータマネジメントの実践~データを深く理解するために~”, IR初級人材育成研修
    会,2021
    [16] DAMA International(編著)、DAMA 日本⽀部 Metafind コンサルティング株式会社(監訳) ,“データマネジメン
    ト知識体系ガイド”,2018

    View Slide