Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Expert-Level Detection of Epilepsy Markers in E...

Avatar for ほき ほき
August 30, 2025
1

Expert-Level Detection of Epilepsy Markers in EEG on Short and Long Timescales

Avatar for ほき

ほき

August 30, 2025
Tweet

Transcript

  1. https://www.academix.jp/ AcademiX 論文輪読会 Expert-Level Detection of Epilepsy Markers in EEG

    on Short and Long Timescales 東京農工大学 Inoue Ibuki 2025/08/30
  2. 書誌情報 • Expert-Level Detection of Epilepsy Markers in EEG on

    Short and Long Timescales • Jin Li et al. • NEJM AI • 2025/06/26 • doi:10.1056/aioa2401221 引用のない図はすべてこの論文から引用 3
  3. 概要 • 背景 ◦ 脳波記録におけるてんかん様放電は診断と発作発生部位の特定に不可欠 ◦ AIは検出の自動化に有望なアプローチを提供するが偽陽性によって妨げられることが多い ◦ イベントレベルまたはEEGレベルの分類のいずれかを対象とするため臨床的有用性が制限 •

    方法 ◦ 残差ネットワークアーキテクチャに基づく深層学習モデルSpikeNet2を開発 ◦ 専門家によるラベル付けが施されたイベントレベルサンプル32,433件を訓練・評価に適用 • 結果 ◦ EEGレベル分類とイベントレベルスパイク検出両方において高い性能を示唆 • 結論 ◦ イベントレベルのスパイク検出とEEGレベルの分類の両方で専門家レベルの精度を提供すると同時 に偽陽性を大幅に削減 ◦ その二重機能性と多様なデータセットにおける堅牢な性能は、特に資源が限られた環境において臨 床および遠隔医療アプリケーションのための有望なツールとなりうる 4
  4. 先行研究:SpikeNet1 • 目的:発作間欠期てんかん様放電(IED)を自動検出し、EEG記録全体が IED陽性か陰性かを専門家と同等以上の精度で分類 • 入力 ◦ 8人の専門医が注釈を付けた13,262件のIED候補と、IEDなしの8,520件の対照EEG記録 ◦ 専門家の投票割合に基づく「ソフトラベル」

    と困難なサンプル(アーチファクトなど) を含む2段階訓練 • 出力 ◦ 個々のIEDイベントの識別 (イベントレベル検出) ◦ EEG記録全体にIEDが存在するかどうかの 二値分類(EEGレベル分類) 10 [Jin Jing, JAMA Neurology, 2020]
  5. 先行研究:SCORE-AI • 目的:ルーチンEEGの完全自動かつ包括 的な解釈を実現し、異常なEEG記録を正 常と区別し、臨床的意思決定に有用な4つ のカテゴリに分類 • 入力:30,493件のEEG記録で開発・検証。 17人の専門家がSCORE EEGシステムを

    用いて詳細に注釈 • 出力 ◦ 正常 ◦ てんかん様焦点性 ◦ てんかん様全般性 ◦ 非てんかん様焦点性 ◦ 非てんかん様びまん性 11 [Jesper Tveit, JAMA Neurology, 2023]
  6. 訓練データセット • 24人の専門家がアノテーション • イベントレベル分類 ◦ 29,333件のラベル付きイベントを使用 ▪ 弱ラベルサンプル: ラベル付けされていないがスパイク

    に類似するサンプル or 以前の研究 でラベルづけされたサンプル ▪ HNMサンプル: スパイクに似ているが実際にはスパ イクではない識別が困難なサンプル • EEGレベル分類 ◦ 4,087人の患者のEEGセット ▪ 708件が陽性(スパイクあり) ▪ 3,379件が陰性(スパイクなし) 15
  7. 結果と考察 • MGB ◦ ROC曲線(図3A):AUROC 0.973 (95% CI, 0.961~0.982) ハードネガティブマイニングなしのSpikeNet2aやSpikeNet1を大き

    く上回る ◦ 適合率-再現率曲線(図3B):AUPRC 0.995 (95% CI, 0.993~ 0.997) ◦ キャリブレーション曲線(図3C): モデルの予測確率が実際の発生確率とどれだけ一致しているかを 示すキャリブレーション誤差は0.02 (95% CI, 0.01~0.03) ◦ 修正ROC曲線(図3G、3H): 感度と1時間あたりの偽陽性数(FP/hour)をプロットするもので 連続EEG記録における実世界での性能をよりよく反映 mAUC 0.997 (95% CI, 0.994~0.998) を達成 • HEP ◦ ROC曲線(図3D):AUROC 0.942 (95% CI, 0.933~0.950) ◦ 適合率-再現率曲線(図3E):AUPRC 0.948 (95% CI, 0.939~ 0.956) ◦ このデータセットでは、SpikeNet2のAUROCおよびAUPRCは SpikeNet1の ◦ キャリブレーション曲線(図3F):キャリブレーション誤差は 0.065 (95% CI, 0.053~0.078) • 専門家との比較 ◦ イベントレベル分類において、SpikeNet2は人間の専門家の大部分 を上回る性能 19
  8. 訓練方法 • SpikeNet1とSpikeNet2を適用し各EEG記録全体 にわたるスパイク確率の時系列を生成 • 特徴量を作成 ◦ 要約統計量(平均、最大値、標準偏差、中央値、 四分位範囲) ◦

    パーセンタイル ◦ 予測曲線下面積 ◦ [0.5,1]の0.01ステップ刻みの閾値でのスパイク率 • 特徴量を入力としてL1正則化を伴うロジスティ ック回帰モデルが訓練 21
  9. 結果と考察 • MGB ◦ AUROC:0.958 (95% CI, 0.946~0.968) ◦ AUPRC:0.959

    (95% CI, 0.947~0.970) • HEP ◦ AUROC:0.888 (95% CI, 0.829~0.941) ◦ AUPRC:0.823 (95% CI, 0.712~0.911) • SAIデータセット ◦ AUROC:0.995 (95% CI, 0.967~1) ◦ AUPRC:0.991 (95% CI, 0.931~1) ◦ このデータセットでのSpikeNet2の性能は SCORE-AIモデル自体の性能と同等(AUROC 0.997、AUPRC 0.995) • 専門家との比較 ◦ EEGレベル分類において、SpikeNet2は人間の専 門家を上回る性能 22