Upgrade to Pro — share decks privately, control downloads, hide ads and more …

医療データの利活用を支えるデータプラットフォーム / 20220517

医療データの利活用を支えるデータプラットフォーム / 20220517

健康診断やレセプトといった膨大な量の各種医療データが使える形となり活用されていくまでのプロセスについて、これらを支えているプラットフォームのデータフローやシステムアーキテクチャを交えてお話ししました。
#DWH #GCP #BigQuery #Airflow #Python"

momota

May 17, 2022
Tweet

More Decks by momota

Other Decks in Technology

Transcript

  1. DeNAヘルスケアの事業群 執行役員 ヘルスケア事業副本部長 瀬川 翔 執行役員 ヘルスケア事業本部長 米山 拡志 CMO

    (Chief Medical Officer) 三宅 邦明 ・2014年会社設立 ・DeNA100% ・2015年会社設立 ・DeNAと住友商事のJV ▶ 生活者向けデータヘルス事業 ▶ 遺伝子検査サービス ヘルスケア事業本部 ・2021年DeNAグループ入り ・DeNA100% ▶ toC,toB向けに認知症にアプローチ hashtag: #denatech
  2. クレンジング・匿名化・統合DB作成プロセス DeSC (kencom) 保険者1 保険者2 … 生データ • ライフログ •

    アンケート 生データ • 加入者台帳 • 健診結果 • レセプト 生データ DH社による クレンジング • 未コード化病名のコード化 • 疾病別医療費の配賦 データ 統合 匿名 加工 データ 統合 統合DB … データ 統合 個人情報 匿名加工情報 健保・自治体データのクレンジング・匿名化 保険者から受領した個人情報はクレンジングを施した上で匿名加工し、二次利用の許諾後に 全ての保険者でデータを統合した「統合DB(DWH)」を作成。 DPFのデータフローについて 匿名 加工 DH社による クレンジング … 保険者別 匿名加工データ hashtag: #denatech
  3. 一連のデータフローの運用について DPFのデータフローについて … hashtag: #denatech • 月次運用による統合DB(DWH)の作成 ◦ 月次で保険者からデータを連携頂く ◦

    過去に作成した統合 DBは保管 • 一連のプロセスにおけるステークホルダーが多くなってしまう ◦ 匿名加工担当と二次利用担当はセキュリティの都合上分離している ◦ 保険者への納品と許諾をいただく運用、及びその連絡窓口 ◦ etc • 日次更新、ニアリアルタイムといった世界観とは全く違う
  4. DFDの要点 • AWSとGCPの二段構成 ◦ BQは本当に便利 • レセプトデータや健診データのクレンジン グは協業先企業による技術で成り立って いる •

    いくつかのプロセスについては自動化をし ているがまだ途中 • データ品質もより一層の強化が必要 DPFのデータフローについて hashtag: #denatech
  5. 二次利用環境(GCP) DPFのシステムアーキテクチャについて • Managed AirflowであるCloud Composer によるワークフロー(DAG)を構築 • datalake, datawarehouse,

    datamartのよ くある三層モデル • datawarehouse(統合DB)を、サイエンティ ストが分析業務に利用している。 hashtag: #denatech
  6. End