Upgrade to Pro — share decks privately, control downloads, hide ads and more …

病院におけるAIと機械学習の活用|Datamix エグゼクティブフェロー 江崎敦士

Couger
March 06, 2024

病院におけるAIと機械学習の活用|Datamix エグゼクティブフェロー 江崎敦士


✨生成AI x データサイエンス サンフランシスコ最前線 powered by EXE✨

Open AIやMetaのLlamaなど、LLMの発展や画像生成AIの急速な進化が注目を浴びる中、AIの最前線 サンフランシスコでは、革新的な技術が次々と生まれ、未来のAIの可能性が広がっています。
今回のEXEは、最新の現地調査から得た情報をもとに、未来のAIの発展を徹底的に考察します!

<タイムテーブル>
19:00~19:05:オープニング
19:05~19:15:生成AIxデータサイエンスサンフランシスコ動向(クーガー CEO 石井)
19:15~19:30:大規模言語モデルによる次世代レコメンドシステムの構築と戦略(クーガー CEO 石井)
19:30~19:45:病院におけるAIと機械学習の活用(datamix エグゼクティブフェロー 江崎)
19:45~20:00:解約予測で更新リスクを管理(datamix エグゼクティブフェロー 江崎)
20:00~20:20:パネルディスカッション : datamix ceo 堅田 / 博報堂ブロックチェーンイニシアチブ 伊藤 / 石井 / 江崎
20:20~20:50:懇親会

https://peatix.com/event/3821971/view

Couger

March 06, 2024
Tweet

More Decks by Couger

Other Decks in Technology

Transcript

  1. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare Ms. Sonali Tamhankar Sr. Data Scientist Fred Hutch Cancer Center、Seattle USA 腫瘍学、感染症、良性血液学(非悪性血液疾患)に おける世界レベルの専門病院。 年間患者数5.3万人、ノーベル医学賞受賞者 3名) 発表内容 ~病院組織における AIと機械学習の活用~ • ヘルスケアのエコシステム • 病院業務での各種規制に対する Chatbotの活用 • 鎌状赤血球症の緊急医療対応での活用 • 今後の活用分野 【発表者から】 ヘルスケアのような複雑な分野では、機械学習や生成 AI のアプリケーションには多くの活用の機会があります。医 療分野では高度で高価なツールは存在しますが、非営利 のヘルスケアセンターでは規制やリソースの制約の中で 実現可能なのはその一部だけです。 この講演では、技術的なセットアップに加え、ドメイン・コン テキストや現実的な制限を含む多面的なアプローチを用 いたヘルスケア・アプリケーションについてご説明します。 私の望みは、医療組織における生成 AIと機械学習の活 用状況を報告することです。
  2. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare Fred Hutch Cancer Centerでの分析チーム • 研究ユースケースは、各ラボのリソースによって支えられています。医療提供側では、業務、戦略、臨 床イニシアチブのためのアナリティクス・サポートが、品質改善の傘下にあるエンタープライズ・アナリ ティクスによって提供されます。 • 分析チームは、SQLとTableauを駆使し、主要業績評価指標と臨床転帰(※1)を追跡するダッシュボー ドを構築します。当院では、 EPIC社の電子カルテシステム( EHR)を利用しています。EHRに詳しい Epicのエキスパートが在籍し、内蔵の EHR報告ツールを利用して臨床医が情報にアクセスできるよう サポートする教育担当者もいます。 SQLデータマートにはクリニカルノートがあり、情報が構造化された フォーマットで利用できない場合に、これをマイニングすることが可能です。 • 医療提供組織では、個々の活動領域が著しく制限されることがあります。私の目標は、高度なアナリ ティクス・ツール(機械学習やジェネレーティブ AIを含む)を駆使し、ビジネスパートナーの努力をサポー トすることです。 ※1:特定の治療や医療介入の結果として発生する患者の状態や病態の変化を指します。 • 生存率: 特定の治療や手術を受けた患者が一定の期間生存するかどうか。 • 再入院率: 患者が治療を終えた後に再び医療機関に入院する頻度。 • 合併症の発生率: 特定の治療によって引き起こされる可能性のある悪影響や合併症の発生頻度。 • 機能的な回復: 患者が治療や手術の後に元の日常生活に戻る能力。 • 症状の改善: 患者の主観的な症状の緩和や改善の度合い。
  3. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare 病院業務の効率向上を図る為、各種の規制に対するコ ンプライアンスを確認するための Chatbotを導入 米国の病院とPAC(Post-Acute Care Provider)にお いては629の個別規制への遵守が求められ、平均的な サイズの病院(161床)では59FTEを規制遵守に充て、 その4分の1以上が医師と看護師から成り立っていま す。この為、年間平均 $7.6百万の費用が必要で、患者 一人当たりの負担は $1,200となります。 Fred Hutch Cancer Centerでは効率化と費用削減の 為、数か月前にRetrieval Augmented Generation   (※2) を応用したChatbotを試験的導入しました。 このChatbotの構成図は【図1】の通りで、まずベクター ストアを構築して規制に関連する規制関連の書類や外 部情報をなどを効果的に蓄積しました。 ※2:、情報検索や検索結果から取得した情報を生成タ スクに利用する手法を指します。 情報検索(Retrieval): まず、大量のテキストデータやド キュメントから関連する情報を検索・取得します。これ は、特定のトピックに関する質問に対して関連する文や 文書を見つける過程です。 生成(Generation): 次に、取得した情報を元に、新しい 文章や回答を生成します。 【図1】
  4. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare 病院業務の効率向上を図る為、各種の規制に対するコン プライアンスを確認するための Chatbotを導入 【図2】のようなインターフェイスを開発し、 LLM技術を活用し ユーザーからの問に対して回答を表示します。 導入以前では情報が様々なところに格納されていたために 検索や確認に時間がとられていました。現在検索の結果 はあくまでも参照として表示され、最終的には利用者の判 断に委ねられています。この存在はアンドロイドアシスタン トのようなものです。 検索には以下技術を応用しています。 • FAISS(Facebook AI Similarity Search) Chatbotにおいて類似検索を行うために FAISSを導入。こ れにより、規制に関連する情報を迅速に検索できるように なりました。 • Langchainを用いたアプリケーションソフト開発 : アプリケーションソフトの開発に Langchainを使用。これに より、システムの柔軟性や効率が向上しました。 • All-MiniLM-L6-v2の自然言語処理: Chatbotが自然言語処理のタスクに All-MiniLM-L6-v2を活 用。 • Llama2を使用しHugging Faceでのホスティング: LLM(Llama2)を使用して自然言語処理のタスクに対応。 Hugging Faceを利用してモデルをホストし、高度な処理能 力を確保しています。 【図2】 質問例: 期限切れの薬はどのように扱われるべきか?
  5. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare 鎌状赤血球症(Sickle Cell)患者の緊急受信ツールの 開発 発症リスク予測プロジェクトです。 対象とした症例は鎌状赤血球症です。この病気は血液 中の赤血球に含まれるヘモグロビン形状に異常を認め る遺伝性のもので、様態が悪化すると激しい痛みが長 時間続き緊急搬送(ED:Emergency Department)され るケースが多いです。又この病気にかかると数年に1 度再発します。有色人種での発症が殆どですが、事前 に薬の服用で予防が出来、緊急搬送を 3分の一に減ら すことが可能と言われてきました。 データサイエンティストとして、人類の平等性・正義の 為、困難を抱えている人にもベネフィットが得られる、高 リスクの患者を予測することに着手しました。
  6. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare 鎌状赤血球症(Sickle Cell)患者の緊急受信ツールの 開発 回避可能なED受診を減らすために、医療提供者がリ スクの要因を理解し、効果的な介入策を立案できるよう にするにはどうすればよいか?この解決の為に Sickle Cell ED Visit Tool 【図3】を開発し、高リスクの 患者を予測することに着手しました。 プロジェクトのゴールとしては鎌状赤血球症患者の発 症リスクを予測し、医師・看護師等のケアプロバイダー チームにその情報を提供し、チームより患者に適切な アドバイス・処置をすることで救急受診を防止する事で す。 そのためのツールを以下アプローチで開発しました。 • 従来の機械学習アプローチ : 従来の機械学習手法を使用して、救急室受診のリスク が高い患者を特定する予測モデルを構築。 • 生成AIとの統合: ツールキットに生成AIの機能を組み込んで、救急受診 に影響を与える要因に深く追求。 【図3】
  7. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare 鎌状赤血球症患者の緊急受信ツールの開発 ー利用データー 予測モデル構築の為のデータとしては、カットオフ日を 1 年前に設定し、電子カルテデータより特定期間内に少 なくとも2回の診察がある患者を抽出。尚、患者の選択 基準は鎌状赤血球症の診断を受けた患者を対象としま した。特徴のみを持つ患者や家族だけに病歴がある患 者は除外しました【図4】。 • 特徴量:372の候補から以下等50項目の情報を採用し ました • 人口統計情報:年齢、性別などの人口統計情報を 含みます。 • 臨床的情報: • 薬物: 処方された薬の詳細記録。 • 検査: 検査結果果を含みます。 • 運用面からの情報: • 過去の診察: 過去の医療面談情報。 • 過去の救急室受診情報 • 目的変数 カットオフ日から1か月以内に救急室を受診したか 【図4】
  8. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare 鎌状赤血球症の緊急医療対応での活用ーモデル結果ー 【図5】 136人の患者が対象。そのうち 23人が1か月以内に救急 室を受診(目的変数)。 • フィーチャーエンジニアリング : • 頻度の低い値を除外 • 検査値では略語フラグ(値が低い /高い/異常)を使 用。 • ピボットで患者の値の出現回数を数える。 • 372の特徴量の内、目的変数との高い相関を持つ 上位50の列を採用しました。 • トレーニング・テストデータ分割は 75-25。 • モデル: • ランダムフォレストモデルを採用。 • n_estimators= 200 • max_depth= 6 • max_leaf_nodes= 9 • 性能評価(AUC):ROC曲線下の面積は0.85。 【図5】
  9. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare シャープレイ値(Shapley Values)に基 づく機械学習モデルの説明の核心的 な考え方は、各特徴量(入力の変数) がモデルの出力に対してどれだけの寄 与を持っているかを、協力ゲーム理論 から得られた公平な配分結果を基にし て評価し、それを用いてモデルの出力 を説明することです。 大規模な言語モデルに基づくツール は、臨床医が患者とのメモや会話を自 然な言葉で行うことを可能にします。こ れらのツールは、臨床医が幻覚を見な くても、必要な情報源を簡単に参照で きるようにし、巧みなアシスタントとして 機能します
  10. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare • Toolにログイン後、ハイリスク 患者の一覧が表示される
  11. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare Work in Progress • ツールの改善 • 検証と改良。 • モデルの改善。 • インターフェースの改良。 • すべての患者のED受診の範囲を拡大 • 米国国立衛生研究所の人工知能機械学習コンソーシアムによる健康の公平性の推進と研究者の多 様性フェローシップ関係者プロジェクトへの参画。 • より大規模なコホート(※1)、より多様な集団への範囲の拡大 • 技術面 • インフラの拡張検討 : 現行のセットアップでは、大規模なベクターストアにスムーズに拡張できない状況が生じていま す。 これを改善するために、インフラの拡張を検討する必要があります。 • 大規模なLLMの導入: より質の高い解答を得るためには、より大規模な言語モデル( LLM)の導入が考慮されます。これによ り、複雑な文脈や情報をより的確に理解し、解釈する能力が向上します。 • エージェントの活用: より高い精度の回答を得るために、患者記録の様々な側面を引き出すためのエージェントの活用が重 要です。これにより、症例に関連する重要な情報を的確に取得し、効果的な診断や対応が可能となりま す。 ※1:コホートは同じ期間に同じ出生地や共通の経験を共有する集団を指す。
  12. ©2024 Datamix Co., Ltd. All rights reserved. Generative AI and

    Machine Learning in Healthcare Takeaways • ヘルスケアのエコシステムは複雑であり、特に医療提供組織においてはなおさらです。この領域で働くことの 課題に創造的に取り組むことができれば、有意義な仕事をするまたとない機会があります。私たち一人ひと りが、日々の仕事を通じて変化をもたらす力を持っています。 • 現場で専門知識を持った人々とのパートナーシップは非常に重要であり、彼らの知識・作業を自動化に置き 換えることは困難です。 LLMに基づくツールは、特に、ソース情報に容易にアクセスできるユーザーの有能な アシスタントとして責任を持って使用される場合、大きな価値を付加することができます。 • 従来の機械学習ツールキットと生成 AIを組み合わせることで、実用的な洞察のための対話型ツールを設計 することができます。この広大で動きの速い空間には、強力な開発者用ツールがあり、大きなチャンスが存 在します。知識共有とネットワーキングの機会を与えてくれたデータサイエンス・サロンに感謝します。