CNN application for earthquake detection 27 views

Convolutional neural network for earthquake detection and location 畳み込みニューラルネットワークを用いた地震検知と震央推定
Department of Earth and Planetary Science, School of Science, The University of Tokyo (Perol et al., 2018) Ryo Namiki

Introduction Method Network architecture Training the network Evaluation on an
independent testing set Result Data Generating location labels Extracting windows for classification Training/testing sets Data set augmentation ConvNetQuake Detection accuracy Location accuracy Probabilistic location map Generalization to nonrepeating events Earthquake detection on continuous records Comparison with other detection methods Scalability to large data sets Discussion Outline

Introduction

Social Reactions

Introduction 繰り返し地震検出計算コスト特徴 Template matching ◦ ◦ O(N) Waveform
Autocorrelation ◎ × O(N2) 長期間の波形に適用しにくい FAST ◦ ◦ O(N1.36) 特徴抽出の過程で震源の情報が失われる ConvNetQuake（畳み込みニューラルネットワーク（CNN）モデル） • ラベル（イベントが含まれているか・どこでイベントが起きたか）付きの波形を学習 →多層の非線形フィルターで特徴抽出＝ディープラーニング • 学習済みモデルを用いると、波形からイベント検知・震央推定ができる • 震央推定に必要なのは「単一観測点」の波形 • 石油・ガス業界の企業により、産業排水を地下深くに注入していることを原因とした微小地震～中規模の地震が多く発生。 • 既存の手法は中～大規模の地震検出を目的とし、微小地震の検出は困難。

Method

Network architecture ConvNetQuake 入力：3チャンネルの波形窓(D個) 出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event
2 : earthquake in cluster 1 … M : earthquake in cluster M-1 畳み込み層（Convolution layer）・境界ではzero padding Z :featuresテンソル(2次元テンソル) W :重みテンソル σ(x)= max(0,x) :ReLU関数 i ∈{1,…,8} : 畳み込み層の深さ c ∈{1,…,32} :i層のチャンネル c’:i-1層のチャンネル C’:i-1層のチャンネル数 i = 1 → C’=3 i ∈{2,…,8} → C’=32 t :i層のfeatureの位置(0層ではtime indexに相当) t’ ∈ {1,2,3} :i層に畳み込まれるi-1層のfeaturesの相対位置 s = 2 : フィルタのスライド幅 b :バイアス項・フィルタサイズが小さい →浅いレイヤー：高周波数の特徴抽出深いレイヤー：低周波数の特徴抽出

Network architecture ConvNetQuake 入力：3チャンネルの波形窓(D個) 全結合層（Fully connected layer） z 全結合層のfeatures Zbar
Flatten layerのfeatures W 重みテンソル c ∈{1,…,M} 全結合層のfeatures c' ∈{1,…,128} Flatten layerのfeatures b バイアス項全ての層を全結合するモデル(Kong et al.)より・ N4程度計算コストが小さい。・パラメタ数が減り、過学習を回避しやすい。出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event 2 : earthquake in cluster 1 … M : earthquake in cluster M-1

Network architecture ConvNetQuake 入力：3チャンネルの波形窓(D個) 出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event
2 : earthquake in cluster 1 … M : earthquake in cluster M-1 出力層（Output layer） p 各クラスターに分類される確率 c ∈{1,…,M} 各クラスター Z0 入力された波形 W 重みテンソルの集合 b バイアス項の集合 z 全結合層のfeatures ・ソフトマックス関数により、特徴量zをpに変換 →pを各窓が各クラスターに分類される確率と解釈

Training the Network L2正規化された交差エントロピー損失(L)を最小化するようにCNN(ConvNetQuake)を最適化訓練データ(N=702,748)はメモリ容量に対して大きすぎる →ミニバッチ＝128個の波形窓（64 個のイベント窓＋64のノイズ窓）に
よる確率的勾配降下法(SGD) SGDのアルゴリズム:Adam 最適化アルゴリズムにはADAMを用いた。学習率を10^-4とし、他のパラメタはデフォルトのままにした。 CNNのパラメタを逆誤差伝搬法により、損失の改善が止まるまで更新 L 交差エントロピー損失 N 波形窓の総数 M クラスターの総数 k ∈{1,…,N} 波形窓のインデックス c ∈{0,…,M-1} クラスターのインデックス q 正しい確率分布(ウィンドウkのクラスターがcなら1,そうでなければ0) p 予測した確率分布(ウィンドウkがクラスターcであると予測する確率) λ = 0.001 L2正則化パラメタ W 重みテンソル i ∈{1,…,9} 層の深さ

Adam m: 勾配の一次モーメント（平均値） v: 勾配の二次モーメント（分散）

Result

Data その１ Oklahoma Geological Survey(OGS) カタログの 2021個のイベント期間 :
2014/2/15 - 2016/11/16 規模 : Mw -0.2 - 5.8 その２ 2つの速度型地震計(GS.OK027, 029)の波形(地動速度, ground velocity) ・期間 GS.OK027 2014/2/14 - 2015/3/3 GS.OK029 2014/2/15 – now ・周波数帯 100Hz ・チャンネル HHZ(垂直), HHN(N-S), HHE(W-E) Generating location labels ユークリッド距離を基準としたK-meansアルゴリズムによって、2,021個のイベントを6つの地理クラスターに分類 →波形窓は7つのクラスタに分類される：・イベントなし・イベントあり（地理クラスター1 - 6） Fig. 1. ★：地震計の位置 Colored dot : 訓練データ用イベント Black dot : テストデータ用イベント

Extracting windows for classification 地震計GS. OK027, 029の波形をそれぞれ月毎に分割 ↓ 各チャンネルで、振幅平均が0、振幅絶対値の最大が1になるように正規化 ↓
OGSカタログに基づき、2種類（イベント窓・ノイズ窓）の10s窓を抽出 1. イベント窓 2,918個 2. ノイズ窓(イベントを含まない窓) 831,111個本研究のモチベーション：ノイズ窓の中に存在する微小地震を検知したい Training/testing sets イベント窓ノイズ窓訓練データ 2,709 700,039 テストデータ (2014年7月の波形) 209 131,972

Data set augmentation 一般に、訓練データが少ないと、過学習が起き汎化性能に優れない。 →訓練データを水増しする(Data augmentation) ・GS.OK027, 029の２つの観測点データを用いて、イベントをダブルカウントしているのも一種の水増し Fig. S1.
GS.OK027(左), 029(右)で同じイベントを観測・さらに、生の訓練データにガウスノイズ(平均0)を加えたもので水増し

ConvNetQuake 入力：3チャンネルの波形窓(D個) 出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event 2 :
earthquake in cluster 1 … M : earthquake in cluster M-1 ・3チャンネルの波形窓を入力すると、波形がイベントを含むか含まないか、含む場合にはどの地理クラスターに分類されるかを予測・パラメタは、訓練データのクラスター分類の不一致を最小化するように最適化される。（教室付き学習）畳み込み層（Convolution layer）平坦化（Flattenning）全結合層（Fully connected layer）出力層（Output layer）

Autocorrelationの結果 ConvNet Quakeの予測結果イベント窓ノイズ窓イベント窓 TP: 2111 FP:
116 2,227 ノイズ窓 FN: 0 TN: 129,954 129,954 2111 130,070 ALL: 132,181 適合率 precision = (TP)/(TP+FP) = 94.8％再現率 recall = TP/(TP+FN) = 100％ Table. 1. ３手法の比較 OGSカタログ ConvNet Quakeの予測結果イベント窓ノイズ窓イベント窓 TP: 209 FP: 2,018 2,227 ノイズ窓 FN: 0 TN: 129,954 129,954 209 131,972 ALL: 132,181 適合率 precision = (TP)/(TP+FP) = 9.38％再現率 recall = TP/(TP+FN) = 100％ Detection accuracy 適合率：イベント窓と判定した窓が、本当にイベント窓である割合再現率：本当のイベント窓を検出できている割合 ※ConvNetQuakeがイベントとみなした窓のうち1,902個はOGSカタログには乗っていないがAutocorrelationではイベントとみなせている。対象 2014年7月の波形

Location accuracy • 6個の地理クラスター分類精度＝検出したイベントが正しい地理クラスターに分類されている割合：74.6％議論：ランダムな分類1/6=16.7％より高い文句：但し、クラスタの範囲は約10km×10km… • 50個の地理クラスター分類（クラスタの範囲は約数km×数km）精度：22.5％
議論：ランダムな分類1/50=2％よりは高い… 原因：一つのクラスターにある訓練データが少ない(約40個)ため精度が悪い Fig. S2. 地理クラスターを50個に分割した場合 Fig. 1.（再掲） ★：地震計の位置 Colored dot : 訓練データ用イベント Black dot : テストデータ用イベント

Probabillistic location map Fig. 3. イベントが各地理クラスターに分類される確率分布左は正しく分類されたイベント。右は誤って分類されたイベント。

Generalization to nonrepeating events 他の手法とは異なり、ConvNetQuakeでは訓練データと似ていない波形のイベントも検出できる。 Fig. S4. 2つのテンプレート波形 polarityとパルス継続時間が異なる左：T1
2014/8/3 04:57:59~ GS.OK029 右：T2 2014/4/1 17:07:19~ GS.OK029 テンプレートにガウスノイズを加えたイベント45個をランダムな位置に組み込んだ合成波形を作成訓練データ(T1) ： 4 day-long、ノイズSNR(-5 ~ 1 dB) テストデータ(T1) ： 10 day-long、ノイズSNR(-1 ~ 8 dB) テストデータ(T2) ： 10 day-long、ノイズSNR(-1 ~ 8 dB) →訓練データ(T1)で学習し、テストデータ(T2)からイベントをどれだけ検出できるか？ Fig. S3. 合成波形の例ノイズを加えたT1をランダムな位置に組み込んだ合成波形（合成波形自体のSNRは3dB）お宝探しによる検証

Generalization to nonrepeating events 訓練データ(テンプレートT1)で学習 ↓ テストデータ(T1) ： ConvNetQuakeもTMMも全てのイベントを検出テストデータ(T2)
： ConvNetQuakeのみが十分な検出率 ConvNetQuake (CNN)とTemplate matching method(TMM)を比較 Fig. 4. 2つの手法による検出精度横軸：テストデータ中のテンプレート波形に加えたノイズのSNR 縦軸：イベント検出率お宝探しによる検証の結果他の観点再掲 Fig. 1. ★：地震計の位置 Colored dot : 訓練データ用イベント Black dot : テストデータ用イベント CNQでは繰り返しでないイベントの検出にも成功している。 →汎化の証拠

Earthquake detection on continuous records 手法地震計GS.K029の2014年7月の波形をConvNetQuakeで計算波形を10秒窓で分割(1秒オーバーラップ) 結果 OGSカタログで既知のイベンドに加えて、4,225イベントを発見
(5イベント/h以上に相当)。 Autocorrelationでは3,949イベントを発見。 Subspace detection methodでは5,737イベントを発見。 Fig. 5. 2014/7/7 16:29:11~のイベントに似ているとしてConvNetQuakeが検出した波形窓 (縦軸)ConvNetQuakeが検出した479のイベント (横軸)S波到達時間で揃えたtime index (下図)全イベントのstack

Scalability to large data sets Fig. 6A. 計算時間の比較※ Fig. 6B.
メモリ使用量の比較横軸 : 波形データの継続時間左図縦軸：計算時間※ 右図縦軸：メモリ使用量計算時間の比較 ※ConvNetQuake: 訓練データからの学習時間(1.5時間)を除く FAST: テンプレートデーターベースを作る時間(47分)を除き、類似性検索の時間のみを考慮・ConvNetQuakeの計算速度は FASTの48倍、autocorrelationの13,500倍・データのスケールと計算時間は線形メモリ使用量の比較 FAST：データーベースをメモリ上に置くため、メモリ消費が多い。 ConvNetQuake：パラメタ値だけをメモリに置けば良いので、メモリ消費が少ない。（もちろん、オフライン学習時にはたくさんメモリを使う）オフライン学習を考慮した計算時間(破線)

Discussion(Conclusions) ConvNetQuake(CNN) 単一観測点波形からのイベントとイベントの位置の確率的検出にstate-of-the-art(最先端)な性能を発揮イベント検出：精度100％、適合率94.8％位置の分類：約10km四方で精度74.6％、数km四方で精度22.5％ ConvNetQuakeの短所：十分な訓練データ（震央位置が判明している）が必要地震活動の低い地域や観測設備・観測データの乏しい地域にはそぐわない手法 ConvNetQuakeの長所： •
訓練データが沢山あれば、非常に優れた性能を発揮 • 既存の手法より短い計算時間、少ないメモリ使用量 • 一つの観測点の波形で推定可能 • 一度学習してしまえば、高速な地震検出と位置決定が可能 →日本などの緊急地震速報システムへの応用が有効

CNN application for earthquake detection 27 views

CNN application for earthquake detection 27 views

Ryo

More Decks by Ryo

Other Decks in Science

Featured

Transcript

Convolutional neural network for earthquake detection and location 畳み込みニューラルネットワークを用いた地震検知と震央推定

Introduction Method Network architecture Training the network Evaluation on an

Introduction

Social Reactions

Introduction 繰り返し地震検出計算コスト特徴 Template matching ◦ ◦ O(N) Waveform

Method

Network architecture ConvNetQuake 入力：3チャンネルの波形窓(D個) 出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event

Network architecture ConvNetQuake 入力：3チャンネルの波形窓(D個) 全結合層（Fully connected layer） z 全結合層のfeatures Zbar

Network architecture ConvNetQuake 入力：3チャンネルの波形窓(D個) 出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event

Training the Network L2正規化された交差エントロピー損失(L)を最小化するようにCNN(ConvNetQuake)を最適化訓練データ(N=702,748)はメモリ容量に対して大きすぎる →ミニバッチ＝128個の波形窓（64 個のイベント窓＋64のノイズ窓）に

Adam m: 勾配の一次モーメント（平均値） v: 勾配の二次モーメント（分散）

Result

Data その１ Oklahoma Geological Survey(OGS) カタログの 2021個のイベント期間 :

Extracting windows for classification 地震計GS. OK027, 029の波形をそれぞれ月毎に分割 ↓ 各チャンネルで、振幅平均が0、振幅絶対値の最大が1になるように正規化 ↓

ConvNetQuake 入力：3チャンネルの波形窓(D個) 出力：各窓が各クラスターに分類される確率(D×M行列) 1 : No event 2 :

Autocorrelationの結果 ConvNet Quakeの予測結果イベント窓ノイズ窓イベント窓 TP: 2111 FP:

Probabillistic location map Fig. 3. イベントが各地理クラスターに分類される確率分布左は正しく分類されたイベント。右は誤って分類されたイベント。

Generalization to nonrepeating events 他の手法とは異なり、ConvNetQuakeでは訓練データと似ていない波形のイベントも検出できる。 Fig. S4. 2つのテンプレート波形 polarityとパルス継続時間が異なる左：T1

Generalization to nonrepeating events 訓練データ(テンプレートT1)で学習 ↓ テストデータ(T1) ： ConvNetQuakeもTMMも全てのイベントを検出テストデータ(T2)

Earthquake detection on continuous records 手法地震計GS.K029の2014年7月の波形をConvNetQuakeで計算波形を10秒窓で分割(1秒オーバーラップ) 結果 OGSカタログで既知のイベンドに加えて、4,225イベントを発見

Scalability to large data sets Fig. 6A. 計算時間の比較※ Fig. 6B.