Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[GECCO22] Evolving SimGANs to improve abnormal ...

daiki
June 24, 2023

[GECCO22] Evolving SimGANs to improve abnormal electrocardiogram classification

[GECCO22] Evolving SimGANs to improve abnormal electrocardiogram classification

daiki

June 24, 2023
Tweet

More Decks by daiki

Other Decks in Research

Transcript

  1. Evolving SimGANs to improve abnormal electrocardiogram classification Wang, G., Thite,

    A., Talebi, R., D'Achille, A., Mussa, A., & Zutty, J. 2022. Evolving SimGANs to improve abnormal electrocardiogram classification. In Proceedings of the Genetic and Evolutionary Computation Conference Companion (GECCO '22). Association for Computing Machinery, New York, NY, USA, 1887-1894. https://doi.org/10.1145/3520304.3534048 daiki
  2. 背景: 学習データ生成 機械学習モデルの学習には大量のデータが必要 ◼実際のデータを収集することが困難な問題や分野 ➢Ex.) 心電図信号データ ➢時間がかかる,専門家によるラベルづけ,個人情報の取り扱い etc. ◼シミュレータによるセンサー信号生成が有効 シミュレーションの問題点

    ◼実データの特性を十分に反映できていない ➢正常な心電図はシミュレーションできるが,異常な心電図はできない ◼再現した信号と実データの分布が異なる シミュレータにGANを組み合わせて改善する手法が提案されている ◼この手法を用いてシミュレータから学習データの生成を試みる 心電図 2
  3. シミュレーションからリアルなサンプルに変換するGAN 従来手法: SimGAN [Ashish, 17] Refiner R Discriminator D Ashish

    Shrivastava, Tomas Pfister, Oncel Tuzel, Joshua Susskind, Wenda Wang, and Russell Webb. 2017. Learning from Simulated and Unsupervised Images through Adversarial Training. In 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2242-2251. 変更点① ランダムノイズ× シミュレーション信号〇 変更点② Generator× Refiner〇 変更点③ 自己正則化項を追加 3 Real vs Refined Simulation Refined Real 変更点④ 一定領域ごとに 区切って判定
  4. シミュレーションからリアルなサンプルを生成するGAN ◼問題点①: 学習が困難 ➢RとDのバランスを保つ最適なネットワーク構成とハイパーパラメータが不明 ◼問題点②: 評価が困難 ➢生成されたサンプルに対する「リアルさ」の定量的指標がない 問題点: SimGAN [Ashish,

    17] Ashish Shrivastava, Tomas Pfister, Oncel Tuzel, Joshua Susskind, Wenda Wang, and Russell Webb. 2017. Learning from Simulated and Unsupervised Images through Adversarial Training. In 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2242-2251. 4 Refiner R Discriminator D Real vs Refined Simulation Refined Real
  5. ezCGPによる最適化の流れ 5. 解選択 ◼NSGA-Ⅱで解選択 ◼子集団 + Hall of fame最大40個体から ➢Hall

    of fame: 最良個体のアーカイブ? ◼4種類の評価値による4目的最適化 10 ⑤ ブロック 遺伝子
  6. 評価指標 FIDスコア minimize ◼生成された画像の品質を測定する指標 KS統計量 minimize ◼コルモゴロフ–スミルノフ検定 ◼2つの分布が異なるかを調べる 実データの分布と異なる特徴量の数 minimize

    ◼実データと生成したデータから抽出した一般的な特徴量を比較 ◼この論文では9種類(ドメインへの知識で可変) 特徴量分布の平均p値 maximize ◼2つの分布からサンプリングしたものをt検定 ◼有意差がなければ2つの分布は同じ分布からサンプリングされたと考えられ る 16