Upgrade to Pro — share decks privately, control downloads, hide ads and more …

20230316福島医大_疫学セミナー

Tadao Ooka
August 15, 2023

 20230316福島医大_疫学セミナー

Tadao Ooka

August 15, 2023
Tweet

More Decks by Tadao Ooka

Other Decks in Research

Transcript

  1. 2015 医学部 卒業 (MD) 初期臨床研修 開始 大学院博士課程 入学 2017 初期臨床研修

    修了 公衆衛生系の講座に 助教として入局 統計数理研究所と共同研究開始 (疫学/統計/機械学習を学び始める) 2019 大学院博士課程 修了 (PhD) (人工知能・機械学習による 2型糖尿病発症予測モデル構築) 科研費 若手研究1 (将来の健康状態を予測するAI開発) 2021 環境省エコチル研究、 米国小児喘息コホートに参画 (小児コホートデータ・オミックス データへの機械学習適用) 科研費 若手研究2 (医療施設へのAIモデル 実装RCT) 2022 ハーバード大学医学部 (オミックスデータ/AI/疫学の融合 によるアレルギー疾患の病態解明) JST創発研究 (オミックスデータとAIによる 先制医療の社会実装) 今までのキャリア 特定の臨床科に入局せず 研究医としての キャリアをスタート
  2. ! " # $ % & $ 維持 破綻 逸脱

    【現代の医療】 ホメオスタシス破綻後の 症状の進行抑制を 中心とした対症療法 【理想の医療】 ホメオスタシス破綻前に 正常状態へ戻す先行的な介入 正常 疾患 発症 発症 前 先制医療とは? ⇒ 先制医療 井村裕夫先生 (元京大総長)
  3. AI対象者状況(2022.3.25現在) 稼働日数 対象者 同意あり同意なし 治療中 拒否 帰宅希望 単位 20 331

    166 165 69 69 27 (人) 49.5 50.5 41.8 41.8 16.4 (%) 18 188 106 82 39 24 19 56.4 43.6 47.6 29.3 23.2 22 331 207 124 53 43 28 62.5 37.5 42.7 34.7 22.6 20 291 170 121 48 50 23 58.4 41.6 39.7 41.3 19.0 21 294 158 136 48 63 25 53.7 46.3 35.3 46.3 18.4 20 338 196 142 56 65 21 58.0 42.0 39.4 45.8 14.8 21 318 196 122 56 56 10 61.5 38.5 45.9 45.9 8.2 19 306 170 136 69 49 18 55.6 44.4 50.7 36.0 13.2 20 317 203 114 56 58 0 64.0 36.0 49.1 50.9 0.0 19 265 152 113 65 48 0 57.4 42.6 57.5 42.5 0.0 19 294 171 123 63 50 10 58.2 41.8 51.2 40.7 8.1 19 248 127 121 63 50 8 51.2 48.8 52.1 41.3 6.6 219 3227 1851 1376 622 575 179 57.4 42.6 45.2 41.8 13.0 月平均 20 293 168 125 57 52 16 累計 4月 12月 10月 9月 8月 7月 6月 5月 11月 1月 3月 2月 研究参加者 計1851名 同意取得率 76.3% 研究にご参加いただいた。 ↓ 今年度末に結果収集が完了
  4. 実際にAI健康予測表を使用した人間ドック受診者の反応(n=1030) とても有用だと思う 57% 少しは有用だと思う 41% どちらでもない 2% AIによる健康予測は、 健康促進に有用だと思うか 98%

    とても明確になった 56% いくらか明確になった 41% どちらでもない 3% AI健康予測結果で健康に関して 自分がやるべき事が明確になったか 97%
  5. 情 報 # 足 % & ' ( ) *

    + 健 康 . / 見 1 2 化 4 # 5 6 & ' 7 ?
  6. オミックス情報で表される人間のホメオスタシスの変化(糖尿病などの代謝疾患) Kawata et al. iScience 2018 基底状態 (健康な状態) 過渡状態 (疾患発症前)

    適応状態 (疾患発症後) 疾患発症前の健常者を見つけ出し、健康な状態に戻すことで代謝疾患が予防可能になる 代謝疾患: 2型糖尿病・メタボリックシンドローム・がん・炎症性疾患 等
  7. 国⽴研究開発法⼈科学技術振興機構 AIとオミックス情報の融合による先制医療の社会実装への挑戦 おおおか ただお ⽒名︓⼤岡 忠⽣ 所属︓⼭梨⼤学 役職︓助教 〜 あらゆる病気を未然に防ぐ医療システムの実現へ

    〜 <研究概要> 遺伝⼦やたんぱく質、代謝物といった⼈間の⽣体情報を網羅的に収集し、⼈⼯知能を⽤いた統 合的な解析を⾏う事で、がんや⽣活習慣病の発症をいち早く検知し、病気の発症⾃体を予防出 来る可能性があります。本研究では、実際の健康診断施設を活⽤して健康な⼈々から網羅的に ⽣体情報を収集し解析する事で、様々な病気を発症前に検知・治療する新たな⼿法を開発し、 更にそれらを社会実装する事で未来の医療システムの実現を⽬指します。 第2期採択 (2024-2031年度実施予定) 19 <略歴> 2015年⼭梨⼤学医学部卒業(MD)、2017年⼭梨⼤学附属病院初期臨床研修修了、2019年同⼤学にてPhD取得。 2020年社会医学系専⾨医・労働衛⽣コンサルタント取得。2017年より⼭梨⼤学医学部社会医学講座特任助教。 2021年よりハーバード⼤学医学部・マサチューセッツ総合病院救急部 リサーチフェロー(現在、⽶国留学中) 開発済みの糖尿病予測AIモデルを活⽤し、 ⼈間ドック受診者35,000名(年間)の中から 約100名の2型糖尿病 発症直前群を同定 2型糖尿病 発症直前群 発症前後でオミックス・ウェアラブル情報を収集 疾患発症直前 疾患発症直後 ① 代謝疾患における発症前病態の解明 ② 超早期診断/治療を実現する⼿法の開発 人間ドック・受診データ ウェアラブルデータ ホ メ オ ス タ シ ス の 破 綻 プ ロ セ ス を 可 視 化 変 化 部 位 の 同 定 同定した発現部位のみ 他集団(1000⼈)で再検証 35,000名 100名 試験的 社会実装
  8. 過去2年間の健康診断データから 1年後のHbA1cの急上昇(0.5%以上) を予測する機械学習モデルの開発 開発モデル: 感度92.9%、特異度87.7% HbA1c:6.0-6.4%の 12000人から100人を 予測した場合 → 陽性的中率

    60.1% Ooka et al. BMJ Nut Prev Heal 2020 機械学習モデルによって 12000人から予測・選別した 100人のうち60人はHbA1cが 急上昇して2型糖尿病を発症する。 2型糖尿病の発症率60%の 集団を選定する事が出来る どうにか疾患発症直前の患者だけに集団を絞ることはできないか?
  9. 2024年度人間ドック受診者の 前年度と当日の健診データから 2型糖尿病 発症直前群を同定 35000人/年 2型糖尿病 発症直前群 約100人 人間ドックで収集された血液検体を利用 ゲノム・エピゲノム

    トランスクリプトーム解析 プロテオーム解析 メタボローム解析 マイクロアレイ解析・質量分析装置等 人工知能・機械学習を用いた トランスオミクス解析の実践 開発済み 機械学習 モデル 研究方法 ウェアラブルデータ + 人間ドック結果 次世代DNSシークエンサー
  10. オミックスデータから疾患予測・病態解明を行うアプローチ 例)細気管支炎の重症化を決める プロテオーム発現部位を特定 Ooka et al. Pediatr Allergy Immunol. 2021

    Prof. Carlos Camargo ハーバード大学 Prof. Camargo/Hasegawa Lab (オミックス解析×一次予防戦略のトップ研究室) 1200種類のプロテインに機械学習・因果推論を適用。 アレルギー疾患の重症化を予測・予防するために、 IL-17とVSIGというプロテインを確認する必要があること、 またこれらのプロテインを制御するpathwayを明らかにした。 → 全てのオミックスでこれらのアプローチを実現したい Prof. Kohei Hasegawa
  11. “Bronchiolitis” is a significant problem • Clinical syndrome with multiple

    definitions worldwide • Acute lower respiratory infection with inflammation, caused by respiratory virus(es) – e.g., RSV, RV • Acute morbidity: #1 cause of infant hospitalizations in the US (~130,000 each year); 2%-3% of all infants • Chronic morbidity: Among hospitalized infants with bronchiolitis (“severe bronchiolitis”), 30%-40% will develop childhood asthma Camargo/Hasegawa研究室のメインテーマ (急性)細気管⽀炎 全⽶の乳児⼊院の原因No.1 RSウイルスによって引き起こされる 30-40%が⼩児喘息に移⾏する
  12. Major assumption Bronchiolitis is a homogenous disease with a similar

    mechanism… But… Hasegawa, Hartert et al. Exp Rev Respir Med 2017 細気管⽀炎は今まで同じメカニズムを持つ単⼀の疾患だとされてきた
  13. Microbiome Host (eg, DNA, epigenome) Response (eg, transcriptome, proteome, metabolome)

    Endotype A Endotype B Endotype C “Bronchiolitis” Endotype A Endotype B Endotype C “Asthma” Internal Environment External Environment Incl. viruses Theoretical model 体内のオミックス情報で 細気管⽀炎のタイプが 決定される タイプを決定して、 治療戦略を変える事で、 精密医療を実現 細気管⽀炎 には様々なタイプがある
  14. MARC infant cohorts MARC-30 USA MARC-30 Finland MARC-35 MARC-43 U01

    Unfunded U01, R01s, UG3 UG3/UH3 16-center prospective 3-center prospective 17-center prospective 5-center prospective n=2,207 n=408 n=1,016 n=720 Bronchiolitis (age <2yr) Bronchiolitis (age <2yr) Bronchiolitis (age <1 yr) Healthy control (age <1yr) Acute severity Acute severity Asthma Acute severity Asthma (& phenotypes) Asthma (& phenotypes) Ongoing Ongoing Ongoing 世界最⼤の 乳児細気管⽀炎 オミックスコホート
  15. タイプA タイプB タイプC 細気管支炎によって入院した赤ちゃんのプロテオームを 血液から網羅的に測定、教師なし機械学習でタイプ分け 53% 44% 22% 6歳時までに 小児喘息発症

    タイプAに分類されると 喘息発症しやすいと判明 更にプロテオーム分析から タンパク質複合体NF-kB の関与が示唆された プロテオームを用いる事で、喘息になりやすい児とその原因を推測できた。 ⇒ プロテオームを用いて小児喘息を早期に予測/予防できる可能性 6 年 間 追 跡
  16. Nasopharyngeal metabolome profiling of 918 infants with severe bronchiolitis Consensus

    clustering analysis A: glycerophosphocholine-high (n=79) B: amino acid-high, polyunsaturated fatty acid-low (n=72) C: amino acid-high, glycerophospholipid-low (n=363) D: glycerophospholipid-high (n=177) E: mixed (n=227) Derived metabotypes Nasopharyngeal airway metabolome endotyping of severe bronchiolitis in infancy and risk of childhood asthma Association of metabotypes with clinical outcomes Zhu et al. JACI, 2022b Recurrent wheeze by age 3 years with asthma at age 5 years A: glycerophosphocholine-high B: amino acid-high, polyunsaturated fatty acid-low VS. Asthma at age 5 years Adjusted odds ratio=2.18 (95% CI, 1.03-4.71) Adjusted hazards ratio=2.52 (95% CI, 1.16-5.47)
  17. 39 Genetics Phenotypes (Outcome) GWAS Outcome ~ Gene (SNP) +

    Age + sex + PC1 + PC2 +… × 1000万SNPs (i.e., for each SNP on each chromosome) e.g., childhood asthma (Yes/No) Plot P-values for all SNPs Adjusting for ancestry difference GWAS (genome-wide association study) 解析 Manhattan plot 二値アウトカムと全ての遺伝子(塩基多型)との関連を 網羅的にロジスティック回帰分析を用いて調べる解析 遺伝子(gene)と疾患(phenotypes)との関連 が分かる →遺伝子がどのように、何を通して疾患と関 わるかについてはわからない。
  18. 40 遺伝子データと他のオミックスデータの融合 Genetics Transcriptome (mRNA) Epigenome Protein Metabolite eQTL analysis

    mtQTL analysis (metabolite quantitative trait loci): Metabolite ~ Gene (SNP) + Age + sex + PC1 + PC2 × 1000万SNPs (i.e., for each SNP on each chromosome) Plot P-values for all SNPs mQTL analysis mtQTL analysis pQTL analysis microRNA miR-QTL analysis Manhattan plot 遺伝子(gene)と代謝物(metabolites)との 関連が分かる →遺伝子がどのように疾患に関わるのかを 推論できる。 各オミックスデータの発現量(連続変数) をアウトカムにして、同じregressionをする
  19. 41 Metabolite quantitative trait loci (mtQTL) 解析 28 candidate metabolites

    28 candidate metabolites 28 candidate metabolites mtQTL analysis × 28 times 10,852,874 SNPs 10,852,874 SNPs 10,852,874 SNPs mtQTL analysis × 28 times mtQTL analysis × 28 times 喘息発症に関わる28個の代謝物を特定 28代謝物に関わる遺伝⼦を特定 →既存の喘息関連遺伝⼦と⽐較
  20. New analytic proposal: オミックス情報の画像への変換 43 Host Transcriptome Metabolome Transcriptome- metabolome

    Interaction Feature selection tPCA/ tSNE New methodology based on the DeepInsight method (Sharma et al. Sci Rep. 2019 )
  21. オミックス変換画像の深層学習モデルへの実装 46 ケース コントロール *Prediction score for the current model:

    Training AUC: 1.00 Test AUC: 0.875 Naoto Usuyama, Microsoft Research 画像だけで ケース群を 9割近く特定
  22. 画像のどの部分が判定に寄与しているのか? (DeepFeature method using Grad-CAM) 47 The previous slide Based

    on Sharma et al. Brief Bioinformatics 2021 画像のどの部分が疾患重症度に関 わっているかを確認できる。 → 疾患関連オミックス群を同定 Grad-CAM
  23. ChatGPTとは? 50 Co-founder: Elon Musk CEO: Sam Altman • ChatGPT

    は OpenAI により開発された会話特化型のAI • ChatGPT はGPT-3 (Generative pre-training transformer 3) というモデル を⼟台にしている。(今週からGPT-4も利⽤可能に) • トランスフォーマー* というモデルを⼟台に、インターネットアー カイブや多くの本を学習させたものがGPT-3/4であり、加えてSNSの ログなどを学習させ、⼈間との対話に特化させたのがChatGPT。 *Vaswani et al. (Google) 2017.
  24. 51

  25. どのように ChatGTPは作られているのか? 52 未訓練の トランスフォーマーモデル https://jalammar.github.io/how-gpt3- works-visualizations-animations/ A robot must

    - be (40%) - obey (30%) - protect (15%) - operate (10%) - comply (7%) - respect (3%) - prioritize (2%) Predict the next word インターネットアーカイ ブや本、Wikipediaなど ⼤量の⽂字データにより 訓練を⾏う 次に来る⽂字や単語を ひたすら予測してく
  26. ChatGPT: よく使⽤する例 1. ⾔語の翻訳・推敲・提案に⽤いる (e.g., Please rephrase the following sentence

    into an academic format) 2. 難しい⽤語・コンセプトについて調べる・理解する (e.g., Can you explain about transformer in the field of deep learning?) 3. メールへの返答や書類の草案を書いてもらう. (e.g., Please write a reply to the following email, … ) 4. 指⽰した内容のプログラムを書く、コーティング補助をする 53
  27. Perplexity: ChatGPT + Google + 引⽤⽂献 54 ・Google検索の結果を⽤いて、 最新の情報を踏まえた回答をして くれる。(例:明⽇の天気は?)

    ・(pubmed)と加える等により、 特定のデータベースからのみ引⽤ する事も可能(右図)
  28. ChatGPT (LLM: Large Language model) はこれからどう拡張していくか ① ⽂献(⾔語)データベースとの連携 ② 検索エンジン・OSとの連携

    ③ ⾮⾔語データベース(バイオ・⼈⼝統計等)連携 ChatGPT (LLM) 単体では ① 情報が不正確な場合がある ② 含まれるのは過去の情報のみ ③ ⾮⾔語データベースを扱えない
  29. LLMを活⽤したオミックス研究(進⾏中) 57 ① Pubmed(⾔語) + Genome Browser(⾮⾔語) データベースを⽤いた LLMモデルの訓練 (⼤量データによる事前訓練)

    LLMモデル (⽣体内オミックス ネットワークを表現) 既存の⽂献・データベースで 事前訓練されたオミックスネットワーク ⾃前のコホート研究のオミックスデータ ⼩児喘息の発症 細気管⽀炎の重症度 最終オミックス ネットワークモデル ③ 疾患の病態に関わる 未知のネットワークを同定できる +⾼確率での疾患発症予測も可能に ②⾃前のデータを⽤いて 最終訓練を⾏う (nは少なくても問題ない)
  30. 60 オミックス情報とAIを組み合わせた 健康最適化・⾏動変容アプリケーションの開発 現⾏アプリ (2022-): 健診結果を⽤いた将来の健康 予測・⾒える化を⽬的としたAIアプリケーション 次期アプリ (2024-): オミックス情報を⽤い

    た網羅的な疾患予測・健康/年齢最適化 将来の検査結果・疾患リ スクの予測と⾒える化。 追加検診を個別提案。 より個別化された健康の⾒ える化・健康/年齢最適化 (例:網羅的な疾患予測、 ⽣体年齢の改善、個⼈の体 質を踏まえた指導、適切な ⾷習慣、腸内環境等の提⽰)
  31. The framework of Multi-omics healthcare App 61 Individual results/ recommendations

    Anonymized User data Developed deep-learning models for every disease/symptom 1. Real-time digital health data 2. Longitudinal multi-omics data 3. Medication/examination data -> Realize “precision medicine “ 0. Medical history/ Questionnaire Health check-up facilities Hospitals Pretraining with latest literature/expressions database Updated with a wide variety of App users’ data Daily life ウェアラブル データ オミックス データ 問診・ 家族歴 投薬・ 検査記録 匿名化 個別の改善提案 最新データベース を⽤いた随時更新 オミックス を⽤いた各 疾患モデル アプリユーザのデータを⽤いたモデル更新
  32. 研究の社会実装・プロダクト開発スキーム ~疫学研究と研究実装が共に推進される 新たな研究エコシステムの実現~ ソフトウェア実装 マーケティング 営業活動 実装・研究協力 コア技術開発 知財管理 研究費創出

    研究推進 エビデンス構築 各科連携・実装協力 関連研究進行・コンサルタント Translational researcher 研究費獲得 ! " # $ ! % & ' ( ) * ! + , - + . データ共有
  33. 今までの別キャリア 〜ビジネス知識・経験の重要性〜 2015 医学部卒業 初期研修中、学習塾立ち上げ 厚生労働省・病院との交渉 2017 パナソニックでの産業医業務 産業医ベンチャー立ち上げ ビジネスの厳しさを知る

    2019 企業用の睡眠時無呼吸症候群の スクリーニング検査を開発 (産業衛生学会 優秀賞・ パナソニックフォーラム最優秀賞) ⇒知財活用のため株式会社設立 企業向けプロダクト開発/販売 2021 将来の健診結果をAIで 予測するプログラムを開発、 健康診断施設にてRCT実施 ⇒ソフトウェア開発協力先・ 実装先とのマーケティング 2022 (ハーバード大学医学部留学) マサチューセッツ総合病院の 産学連携プロジェクトに参与 アカデミアだけでは 社会実装・普及まで たどり着かない。 ビジネス・ リアルワールドの 知識経験が重要 医学部入学後 教育事業立ち上げ 全国化 ビジネスの世界を知る