Upgrade to Pro — share decks privately, control downloads, hide ads and more …

金研究室 勉強会 『Seismic Data Augmentation Based on Conditional Generative Adversarial Networks』

winnie279
November 02, 2021

金研究室 勉強会 『Seismic Data Augmentation Based on Conditional Generative Adversarial Networks』

Seismic Data Augmentation Based on Conditional Generative Adversarial Networks, Yuanming Li et al., 2020, Sensors, 20(23), 6850

winnie279

November 02, 2021
Tweet

More Decks by winnie279

Other Decks in Science

Transcript

  1. どんな研究か? • データ拡張のための合成地震波形を生成 • 条件付きGAN(Conditional GAN, CGAN)ベースの地震波形生成モデル ◦ pix2pixベース →

    U-Netのアーキテクチャ ◦ インプット:ランダムノイズ → ガウスノイズ + 実際の地震波形 • 合成地震波形の分析によって 生成データの品質を評価
  2. モデル • Generator ◦ 合成地震波形を生成 • Discriminator ◦ 合成地震波形を見極める •

    Pre-Trained Feature Extractor ◦ 事前にトレーニングされた特徴量抽出器 ◦ 合成地震波形の品質を向上
  3. モデル • Generator(左上) ◦ U-Netのアーキテクチャ ◦ インプット:ガウスノイズ +       実際の地震波形(2048 ×

    3) ◦ アウトプット:合成地震波形 • Discriminator(右上) ◦ CNNのアーキテクチャ ◦ インプット:地震波形 ◦ アウトプット:実際の地震波形である確率 • Pre-Trained Feature Extractor(下) ◦ CNNのアーキテクチャ ◦ インプット:地震波形・ノイズ ◦ アウトプット:地震波形の特徴量 ◦ 事前に学習しており、その後は学習しない
  4. • データの後処理 ◦ トリミング:両端から24 ポイントを トリミング → 2000 ポイント ◦

    合成地震波形の末端に異常なデータが含ま れる データ • データセット ◦ STanford EArthquake Dataset(STEAD) ◦ M3.0以上 ◦ 100 Hzサンプリング • データ数 ◦ 地震イベント:34,569 ◦ ノイズサンプル:28,211 ◦ トレーニングデータ:テストデータ = 7:3 • データの前処理 ◦ トリミング:2048 ポイント ◦ P波の到達時刻:224 ポイント ◦ ハイパスフィルター:1 Hz → ノイズ低減 ◦ 正規化:振幅を0 - 1で正規化
  5. 結果 • 地震波形の形状の評価 ◦ 実際の地震波形と同様の特徴 ◦ P波, S波 ◦ 最初のノイズ

    ◦ 地震とノイズの振幅比 • Pre-Trained Feature Extractorの評価 ◦ 抽出機を用いないモデルと比較 ◦ a:実際の地震波形 ◦ b:Pre-Trained Feature Extractor(w) ◦ c:Pre-Trained Feature Extractor(wo) ◦ S波:いずれも明確 ◦ P波:woで不明瞭, wで明瞭
  6. 結果 • 地震波形の形状の評価 ◦ 実際の地震波形と同様の特徴 ◦ P波, S波 ◦ 最初のノイズ

    ◦ 地震とノイズの振幅比 • Pre-Trained Feature Extractorの評価 ◦ a:実際の地震波形 ◦ b:Pre-Trained Feature Extractor(wo) ◦ c:Pre-Trained Feature Extractor(w) ◦ S波:いずれも明確 ◦ P波:woで不明瞭, wで明瞭
  7. • 時間 - 周波数領域での評価 ◦ 短時間フーリエ変換(STFT)を計算 → スペクトルの平均を計算 ◦ w:実際の地震波形と同様の特徴

    ◦ wo:不要な高周波数のノイズ 結果 • P波, S波到の分布の評価 ◦ AR-AIC + STA / LTAでP波, S波をピック ◦ P波:wでは実際の地震波形と同様に2秒前後 ◦ S波:すべてのデータで同様の分布
  8. • 評価 ◦ 実際地震波形 > 合成地震波形 ◦ 合成地震波形がパフォーマンスの低下を 引き起こす可能性 ◦

    適切な量の合成地震波形はパフォーマンスを 向上 → 合成地震波形の60% 結果 • 合成地震波形で学習したモデルの評価 ◦ ConvNetQuake, PEROL etal., 2018 • データ ◦ 地震:10,731:5,000 ◦ ノイズ:19,747:8,464 ◦ 合成地震波形:10,731(0%, 20%, 40%, 60%, 100%, 合成地震波形のみ )
  9. まとめ • データ拡張のための合成地震波形を生成 • 条件付きGAN(Conditional GAN, CGAN)ベースの地震波形生成モデル ◦ pix2pixベース →

    U-Netのアーキテクチャ ◦ インプット:ランダムノイズ → ガウスノイズ + 実際の地震波形 • 合成地震波形 ◦ 実際の地震波形と同様の特徴を持つ ◦ 学習パフォーマンスの低下を 引き起こす可能性 ◦ 適切な量の合成地震波形は パフォーマンスを向上