Upgrade to Pro — share decks privately, control downloads, hide ads and more …

人流と COVID-19 の関係性の評価と発表までの議論過程

人流と COVID-19 の関係性の評価と発表までの議論過程

ALBERT Inc.

July 13, 2021
Tweet

More Decks by ALBERT Inc.

Other Decks in Technology

Transcript

  1. www.albert2005.co.jp/ 本社 〒169-0074 東京都新宿区北新宿2-21-1 新宿フロントタワー15F TEL: 03-5937-1610 FAX: 03-5937-1612 東海⽀社

    〒451-6008 愛知県名古屋市⻄区⽜島町6-1 名古屋ルーセントタワー8F TEL: 052-433-3701 FAX: 052-433-3702 ⼈流とCOVID-19の関係性の評価と 発表までの議論過程 2021年7⽉13⽇ 発表内容は報告者個⼈の⾒解に基づくものであり、 報告者が所属する組織の公式⾒解ではない。
  2. 2 ALBERTの事業 ALBERTについて © 2021 ALBERT Inc. 2 当社は、⽇本屈指のデータサイエンスカンパニー※として、ビッグデータアナリティクス領域において最適なソリュー ションを提供しています。コアとなるアナリティクステクノロジーを⽤いた「AI活⽤コンサルティング」「ビッグデータ

    分析」「AIアルゴリズム構築とシステム開発・運⽤」「AIを⽤いた独⾃プロダクトの提供」等のデータソリューション 事業を通じて、より良い社会の実現を⽬指しております。また、国内においてデータサイエンティストが圧倒的に不⾜し ている現状を改善すべく、これまでに培ったノウハウを元に「データサイエンティストの育成⽀援」を⾏なうことで、 データ活⽤のプロフェッショナル⼈材育成に貢献します。 ※データから価値を創出し、ビジネス課題の解決を実現するプロフェッショナル集団
  3. 3 ALBERTの特徴 ALBERTについて © 2021 ALBERT Inc. ALBERTは⽇本最⾼峰の分析⼒、データサイエンス領域におけるコアシステムの 独⾃開発⼒と豊富な実績をもとに、国内でリーディングカンパニーとしての 地位を確⽴しつつあります。

    250名を超える データサイエンティスト集団 分析⼒ ビッグデータ集積から システム実装まで AI開発プロセスを⼀気通貫 ワンストップ サービス 独⾃開発⼒ 1,000件超の プロジェクト実績 そのほとんどが、個別クライアント様 向けスクラッチ開発(伴⾛型) 豊富な実績 3
  4. 4 ⽬次 1. 背景 2. 分析⽬標の策定 3. GISデータと空間疫学 4. 解析結果・考察

    5. COVID-19におけるGISデータの使⽤事例 © 2021 ALBERT Inc.
  5. 7 クラスター対策班の発⾜ n ⽬的 Ø クラスターの早期検知 Ø 発⽣要因の特定 Ø 早期収束の対策計画策定

    © 2021 ALBERT Inc. https://www.mhlw.go.jp/stf/newpage_09743.html クラスターの発⽣防⽌を⽬的にしたクラスター対策班が設置された(2020/2/25) SARS対策の経験者を中⼼に⽇本の感染症対策メンバが集まった
  6. 8 クラスター対策班の発⾜ n 参加メンバ Ø 約30名 p 国⽴感染症研究所 p 北海道⼤学

    p 東北⼤学等 n 各チームの⽬的 Ø 接触者追跡 Ø サーベイランス Ø データ解析 Ø リスク管理 © 2021 ALBERT Inc. https://www.mhlw.go.jp/stf/newpage_09743.html クラスターの発⽣防⽌を⽬的にしたクラスター対策班が設置された(2020/2/25) SARS対策の経験者を中⼼に⽇本の感染症対策メンバが集まった
  7. 9 情報社会における初めてのパンデミック n なぜ呼びかけられたのか Ø 積極的疫学調査は刑事の聞き 込みと同じで、保健所職員に よる対象者の聞き込みにより 成り⽴っている Ø

    感染症は幾何級数的増加をす るため、この対策だけだとす ぐにリソースが飽和する Ø マンパワーを使わずに感染の 流⾏の検知や、予測すること が出来れば対策能⼒を向上さ せる事ができる © 2021 ALBERT Inc. ⺠間企業に対して感染防⽌に資するデータの提供が呼びかけられた(2020/3/27)
  8. 11 ⺠間の受託分析会社がクラスター対策班にジョイン n クラスター対策班の参与の肩書で7名が ボランティアで参画 Ø 4名がフルで現場に張り付き、他は アドバイザー、⽀援要員 n ⻄浦先⽣のデータ解析チーム傘下に

    Ø 分析の⽅針策定として⻄浦先⽣と議 論し、データを使って実装していく 座組 n 個⼈的には20代で厚労省の参与もらっ て、国家的課題の⼀助になれるとあって ⾮常にモチベーションが⾼かった © 2021 ALBERT Inc. https://contents.xj-storage.jp/xcontents/AS80463/7181caed/401d/491d/9c4b/03925045b2dc/140120200506404862.pdf データの処理・分析の仕事を求められた(2020/4/10)
  9. 12 続々と集まったデータたち n 提供企業 Ø ヤフー Ø LINE Ø ソフトバンク

    Ø ドコモ n 我々の参画の前後にデータ提供会社 との折衝も担当 n LINE以外の3つのデータに着⽬して 作業を開始した n 提供データには粒度は異なるが、 地理情報が紐付いていた n 感染症の流⾏との関連を調べるために 「いつ・どこで・誰が・なにをした」かが わかるデータが求められた © 2021 ALBERT Inc. https://www.mhlw.go.jp/stf/newpage_10575.html https://www.mhlw.go.jp/stf/newpage_11116.html https://www.mhlw.go.jp/stf/newpage_10828.html https://www.mhlw.go.jp/stf/newpage_11566.html https://www.mhlw.go.jp/stf/newpage_11564.html 情報の取捨選択
  10. 14 現場における分析ニーズの整理 n ⽬的 Ø 当初のプランとして、 「⼈流を年齢別に調べ接触⾏列を作成することで年齢別の⾏動変容の評価を⾏なう事」とした n 背景 Ø

    参画当時、緊急事態宣⾔下であり緊急事態宣⾔の効果検証のニーズが⽣まれていた Ø 陽性者数が減少の確認には⾏動変容からしばらく経ってからになるため、 即時性のあるモニタリングが求められた Ø ⼈の外出が抑えられれば、「感染を引き起こす接触」も減少するため、⼈流のモニタリングを⾏なうこととした © 2021 ALBERT Inc. 当初の分析⽬標
  11. 15 GISチームの発⾜ n 北海道⼤学の⻄浦先⽣をトップにしたGISチームが発⾜した n メンバー Ø 北海道⼤学の⻄浦 博 教授(理論疫学)

    Ø 東北⼤学の中⾕ 友樹 教授(空間疫学)、永⽥ 彰平 研究員 Ø ALBERTの⾜⽴ 侑駿、稲盛 徹、有⾺ ⼤、中村 ⼀翔 © 2021 ALBERT Inc. GISデータを⽤いた感染症リスク評価を⾏なうためにチームが発⾜
  12. 17 GISデータとは n 地理情報を含んだデータ全般 n 地理情報の種類 Ø ポイントデータ(緯度経度) Ø メッシュデータ(地図を格⼦上に区

    切った区間) Ø ポリゴンデータ(地区・区画) n 国により標準地域メッシュが策定されて いる n メッシュを使った統計をメッシュ統計と 呼ぶ Ø 国の統計は緩やかに住所ベースから メッシュ統計に移⾏中 © 2021 ALBERT Inc. https://www.stat.go.jp/data/mesh/pdf/m-kukaku.pdf (GIS︓Geographic Information System)は地理情報を含んだデータ GISチームはメッシュにおける⼈流データを中⼼に解析をおこなった
  13. 18 疫学の始まり n 空間疫学とは空間的な要素を考慮した疫学研究 のこと n ジョン・スノウが1850年代のロンドンで流⾏ したコレラの感染者をマッピングした感染地図 が有名 n

    当時感染症は瘴気によって広がっていると考え られていた(瘴気説) n 特定の地域における感染者をマッピングするこ とで、同じ地区でも感染の発⽣に偏りがあるこ とを発⾒する n 感染者がいる地区では特定の井⼾⽔を使⽤ n その井⼾を停⽌することで感染が減少した n 瘴気説を否定し、病原体説を実践した最初の例 n 1882年にコッホの原則が発表されて細菌の 存在が確⽴する © 2021 ALBERT Inc. https://www.nationalgeographic.org/activity/mapping-london-epidemic/ 疫学の始まりは空間疫学 ジョン・スノウはコレラの功績により疫学の⽗と呼ばれる 孤児院では感染が少ない 蒸留所は感染がない 井⼾
  14. 19 ケルマック・マッケンドリックモデル © 2021 ALBERT Inc. 𝑑𝑆(𝑡) 𝑑𝑡 = −β𝑆

    𝑡 𝐼(𝑡) 𝑑𝐼(𝑡) 𝑑𝑡 = β𝑆 𝑡 𝐼 𝑡 − γ𝐼(𝑡) 𝑑𝑅(𝑡) 𝑑𝑡 = γ𝐼(𝑡) ケルマック・マッケンドリックモデル[1,2] 別名SIRモデル 特徴:⼈々を同質と仮定 S(t)を時刻tにおける感受性⼈⼝(susceptibles) I(t)を時刻tにおける感染⼈⼝(infecteds) R(t)を時刻tにおける回復ないし隔離された⼈⼝(recoverd or removed class) β: 感染を⽣み出す速度(感染率) γ: 回復・隔離される割合(隔離率) S I R β γ [1]W. O. Kermack and A. G. McKendrick (1927), Contributions to the mathematical theory of epidemics I, Proceedings of the Royal Society 115A, 700-721: reprinted in Bulletin of Mathematical Biology 53(1/2), 33-55 (1991). [2]W. O. Kermack and A. G. McKendrick (1932), Contributions to the mathematical theory of epidemics II. The problem of endemicity, Pro-ceedings of the Royal Society 138A, 55-83: reprinted in Bulletin of Mathematical Biology 53(1/2), 57-87 (1991)
  15. 20 ケルマック・マッケンドリックモデルからわかること © 2021 ALBERT Inc. 𝑑𝐼(𝑡) 𝑑𝑡 = (βS!

    − γ)𝐼(𝑡) 流⾏初期においては感染者は⾮常に少ないため 感受性⼈⼝は全⼈⼝S0 に等しいとみなせる 𝐼(𝑡) = 𝑒"!#𝐼(0) 線形化 λ! = βS! − γ これを解くと 最初期の瞬間成⻑率 λ! > 0の時に感染が増加するので βS! γ > 1 βS! γ = R! これが有名な基本再⽣算数 感染率を下げるか 隔離率を上げると 実⾏再⽣算数は減少する
  16. 21 基本再⽣算数の挙動のおさらい n 基本再⽣算数は世代時間ごとにおける 2次感染者の増加量を表す n 再⽣算数は出⽣率の⽂脈でも⽤いられる n 感染症を感染者数という観点で統⼀的に 評価できる

    n 現実では様々なファクターにより、基本 再⽣算数から異なる動きをするのでそれ を内包した実⾏再⽣算数によって議論が される © 2021 ALBERT Inc. 世代時間における感染者の増減を表す R0 < 1 R0 = 1 R0 > 1
  17. 22 現実における感染症の数理モデル n 実際にシミュレーションに⽤いられているものは古典的SIRモデルよりも複雑 n 古典的SIRモデルは⼈をすべて同質と仮定していたが現実はそうではない n 感受性⼈⼝から隔離状態(Q)に⼊った者も表現したい n 致命率が⾼い感染症であれば、感染者数が増えるほど⼈々は忌避⾏動をとるので予測の困難性が増す

    n 例えば、インフルエンザにおける数理モデルでは年齢区分別に⼈⼝を分けて、多状態モデルとして感染を数理解析 をおこなっている[1] n この問題は構造化個体群ダイナミクスとして知られている[2] © 2021 ALBERT Inc. [1]Emilio Zagheni, Francesco C. Billari, Piero Manfredi, Alessia Melegaro, Joel Mossong, W. John Edmunds, Using Time-Use Data to Parameterize Models for the Spread of Close-Contact Infectious Diseases, American Journal of Epidemiology, Volume 168, Issue 9, 1 November 2008, Pages 1082–1090, https://doi.org/10.1093/aje/kwn220 [2] Metz, Johan A., and Odo Diekmann, eds. The dynamics of physiologically structured populations. Vol. 68. Springer, 2014. 課題 異質性をどれだけ追跡できるかがモデルの良し悪しを⼤きく左右する
  18. 23 感染を抑制するには n 感染を抑制するには感受性⼈⼝(S0 )やを感染率(β)を下げるか、隔離率(γ)を上げることで達成される n 感受性⼈⼝を下げる a. 感受性⼈⼝を隔離してQに移⾏させる(ロックダウンやエピデミックが起きた⼈⼝の隔離) b.

    免疫を獲得してRに移⾏させる(ワクチン) n 感染率を下げる c. 感染を引き起こす⾏動を抑制する(ロックダウン、⾏動変容の促進) n 隔離率を上げる d. 感染者を素早く補⾜する(クラスター対策、検査拡充、医療リソースの拡充) © 2021 ALBERT Inc. βS! γ = R! GISデータを⽤いることによりa,cの評価ができると考えた
  19. 25 初期段階の解析 n 当初の⽬的が形になった数⽇後、専⾨家会議において⼈流の評価データを使⽤したいとオーダーが⼊った n そこで(Zagheni, E., Billari, F. C.,

    Manfredi, P., et al., 2008) の論⽂を参考に年齢別の接触⾏列の集計を おこなった n 前述の論⽂は閉鎖空間における感染リスクを年齢別に評価した論⽂である n この論⽂のコンセプトを応⽤して、特定の地域もしくは年齢別の接触⾏列を作成することで感染リスク評価を ⾏なうことを⽬指した。 © 2021 ALBERT Inc. Zagheni, E., Billari, F. C., Manfredi, P., Melegaro, A., Mossong, J., & Edmunds, W. J. (2008). Using time-use data to parameterize models for the spread of close-contact infectious diseases. American journal of epidemiology, 168(9), 1082-1090. 年齢・地域別の⼈流評価 𝑡$% = 3 &'( ) 3 *'( + 𝑘$ &*× 𝑘% &* ∑ ,'( - 𝑘, &* ある時刻t、メッシュhに存在する集団iが集団jとどれだけ接触ti j したかを上記の式で算出した 𝑘! "#= 時間z にメッシュh にいる集団iの⼈⼝ 上式で求まるtij を要素とする⾏列を接触頻度⾏列Tとし、その変化率を算出している。 ここで集団とは、中⼼駅周辺・オフィス街・繁華街の接触頻度計算では年齢群集団を対象とし、地域間の接触頻度 計算では各都府県の居住者集団を対象とした。
  20. 26 各地域における接触の減少率 n ⼿法 Ø 接触⾏列を緊急事態宣⾔前後で作成 してその減少率を解析した Ø 500mメッシュにおける滞留⼈⼝を 測定

    n 緊急事態宣⾔前(1/19) 緊急事態宣⾔後(4/26) n 発⾒したこと Ø 駅においては駅中⼼において減少が 顕著であった Ø 駅周辺の減少率は同⼼円状ではな く、地域性が反映されている © 2021 ALBERT Inc. 新型コロナウイルス感染症対策専⾨家会議 「新型コロナウイルス感染症対策の状況分析・提⾔」(2020 年4⽉ 22 ⽇) https://www.mhlw.go.jp/content/10900000/000624048.pdf 複数の駅、繁華街、オフィス街における接触の減少率を評価した
  21. 27 n 解析内容 Ø 前述の解析を駅、オフィス、繁華街毎 に集計評価した n 都道府県単位で接触が多い他の都道府県 の⼈の集計をおこなった ©

    2021 ALBERT Inc. https://github.com/contactmodel/20200501/blob/master/0501_public.pdf 解析レポートはオープンにして議論の喚起を狙った 解析結果はGitHub上に公開
  22. 29 難波駅における滞留⼈⼝減少率 n 駅の中⼼地はどの時間帯においても 減少率がたかい n 駅から離れると減少率が低い n 北⽅⾯は減少率が⾮常に⾼い n

    南⻄⽅⾯はむしろ増加している ところがある © 2021 ALBERT Inc. 平⽇ 休⽇ 昼 8:00〜15:59 ⼣〜夜 16:00〜23:59
  23. 30 考察 n 駅に注⽬する理由 Ø 滞留⼈⼝の減少として駅に注⽬するそもそもの背景として、⼈は駅を中⼼に⽇々移動をしているため 駅という結節点の量をみれば⼈の流れを補⾜できるというモチベーションがある Ø しかし、⼈がどこに⾏って何をするか(感染リスクの⼤⼩がある⾏動)は駅だけでは捉えきれない n

    滞留⼈⼝が増加している地点について Ø 図を⾒ると、場所によっては滞留⼈⼝が増加していた Ø ⼈々が外出⾃粛をしていないというわけではなく⽇頃より⾃宅に滞在することが多くなった結果 滞留⼈⼝でみると増加として現れている n ⾃粛率を算出する際の仮定の限界 Ø そもそも500mメッシュにいる⼈はランダムにその中の⼈と接触すると仮定している Ø 公園における100⼈と、居酒屋にいる100⼈が同じリスクを抱えていると捉えている © 2021 ALBERT Inc. この解析の問題点
  24. 32 以降の分析⽅針 n 訪れる地域に着⽬するように変更 Ø 繁華街やオフィス街に該当する地点を抽出 n 居住地を抽出して、分析対象から除外 Ø 深夜⼈⼝を基準にして、深夜⼈⼝から減少しているところを⼈⼝集積地、その逆を居住地とした

    n 接触の密度依存性についての検討をおこなった Ø 該当地域の密度と陽性者数の関係性の調査 © 2021 ALBERT Inc. この解析の改善点 上記の3点の改善をおこなっていった
  25. 35 研究の⽅針 Mobility Change and COVID-19 in Japan: Mobile Data

    Analysis of Locations of Infection Shohei Nagata, Tomoki Nakaya, Yu Adachi, Toru Inamori, Kazuto Nakamura, Dai Arima, Hiroshi Nishiura ⽬的 n ⼈流と陽性者の関係にを調査 Ø ⼈流の変化と陽性者の増減にどのような関係があるかを明らかにする Ø どんな地域の⼈流がより強く影響があるかを明らかにする 研究における注意点 n 訪れる地域に着⽬ Ø 繁華街やオフィス街に該当する地点を抽出 n 昼と夜に⼈⼝が集積するエリアと、減少するエリアを定義 Ø 深夜⼈⼝を基準にして、深夜⼈⼝から減少しているところを⼈⼝集積地、その逆を居住地とした © 2021 ALBERT Inc. Nagata, S., Nakaya, T., Adachi, Y., Inamori, T., Nakamura, K., Arima, D., & Nishiura, H. (2021). Mobility Change and COVID-19 in Japan: Mobile Data Analysis of Locations of Infection. Journal of Epidemiology, JE20200625. https://doi.org/10.2188/jea.JE20200625 陽性者と⼈流になんらかの関係性があるかを調査
  26. 36 ⼈⼝集積地に抽出 n 深夜帯⼈⼝を基準にして、各時間帯に 中央値で1.2以上の増加を⽰すところを ⼈⼝集積地と定義 n ⼀定の⼈流の絶対数でしきい値を設けて 過疎地を除外 n

    ⼈⼝集積地を更に昼の街、夜の街に分割 © 2021 ALBERT Inc. p: workplaces: 2:00 PM–4:59 PM; nightlife places: 8:00 PM–10:59 PM; residential places: 3:00 AM–5:59 AM t: a day ⼈⼝集積地の⼈流に着⽬
  27. 38 ⼈流の推移 n 個⼈的には、⼈の⾏動は未来を織り込ん で動くので、⼈流は先⾏して動いている のでは? n 減少には下限があるように⾒える n 宣⾔中は住宅地の⼈流が増加

    n 3都市において同様の推移をみせた n 2都市のworkplacesと residential placesは緊急事態宣⾔後に元の⽔準に 回復 n 東京のworkplacesは回復せず n nitghtlife placesは元の⽔準に回復せず © 2021 ALBERT Inc. 緊急事態宣⾔前から減少に転じており、宣⾔中は減少が継続 workplaces nightlife places residen3al places
  28. 39 モデル1 © 2021 ALBERT Inc. 地域ごとの⼈流を独⽴させ、どのラグが最⼤になるかを評価 n ⼈流かそれ以外の時間依存のファクター による影響が⼤きいかを評価

    n 過去7⽇間の陽性者をyとした n Lを20として、AICが最⼩になるモデルを 求めた n Pとして、3つの分類をした地域の⼈流で それぞれ⽐較 y: 時点tにおける陽性者数 M: 任意のエリアpにおける時点tの⼈流 ε: 道の時間依存ファクター α、β、ρ: パラメータ c: 陽性者数 ω:ホワイトノイズ
  29. 41 モデル2 © 2021 ALBERT Inc. 地域ごとの⼈流を並列させ、どの地域の⼈流が陽性者数に影響を与えるか評価 n ⼈流かそれ以外の時間依存のファクターによる 影響が⼤きいかを評価

    n 過去7⽇間の陽性者をyとした n Lを20として、AICが最⼩になるモデルを求めた y: 時点tにおける陽性者数 M: 任意のエリアpにおける時点tの⼈流 ε: 道の時間依存ファクター α、β、ρ: パラメータ
  30. 43 考察 n ⼈流を特定の地域、時間における解析をおこなった Ø 具体的には、各条件における⼈流推移と該当地域における 陽性者推移の相関性をGLS推定を⽤いて解析した n 3都市に夜の街における⼈流推移と陽性者推移が⾼い説明性を持っていた n

    このことは、夜の街における⼈の流れが感染拡⼤に⼤きな影響を及ぼす事を ⽰唆している n 個⼈的には、夜の街における特有のコミュニケーション様式が⼀員であると考えている n しかし、この調査はあくまで⼈流を⽤いて評価したマクロ的な研究であり、 感染機序に関するミクロ的な振る舞いを説明してくれない © 2021 ALBERT Inc.
  31. 45 アメリカにおける報告 n 前述と同様な結果はアメリカのレポート でも指摘されている n このレポートはSafeGraph COVID-19 Data Consortiumというアメリカのコ

    ロナのために集められた情報を解析した ものである n 個⼈の携帯の位置情報元に各々がどこに どれだけ滞在したのかが情報として取れ る n 各地点における滞在合計時間を変数とし てSEIRモデルを⽤いて評価している n 右の図はその解析における各地点のリス ク評価である © 2021 ALBERT Inc. Chang, S., Pierson, E., Koh, P.W. et al. Mobility network models of COVID-19 explain inequities and inform reopening. Nature 589, 82–87 (2021). https://doi.org/10.1038/s41586-020-2923-3
  32. 46 COVID-19感染予測 n このモデルの主要説明変数としてGIS データが⽤いられている n 新型コロナにおいてはGISデータの有益 性が広く浸透した事例となった © 2021

    ALBERT Inc. https://cloud.google.com/blog/ja/products/ai-machine-learning/google-and-harvard-improve-covid-19-forecasts googleが公表している予測