コンペ解説 HMS-Harmful Brain Activity Classification

by Rist Inc.

Slide 1

Slide 1 text

Conﬁdential HMSコンペ解説株式会社Rist

Slide 2

Slide 2 text

©Rist Inc. 02 Conﬁdential 1. Competition概要 2. 弊チームの解法紹介目次

Slide 3

Slide 3 text

©Rist Inc. 03 Conﬁdential Competition概要

Slide 4

Slide 4 text

©Rist Inc. 04 Conﬁdential ● 開催情報： ○ 期間: 2024/1 ~ 2024/4 ○ 主催: Harvard Medical School ○ 結果: 9位 / 2767チーム ● 課題： ○ 脳波 (EEG) 信号から、発作など6種類の症状を判定する ○ てんかんなどの診断に役立てるのが目的 ● 評価指標： ○ Kullback Leibler情報量 ○ 評価者の判定分布と AIモデルの予測分布の差を評価 ● Data： ○ 入力 = 1次元の時系列データ (20ch) ○ 出力 = 6クラス分類結果 HMS - Harmful Brain Activity Classiﬁcation 用いられる脳波計出典: https://www.creact.co.jp/measure/eeg/satellite_gemini/ 評価者 (アノテーター) が見ている画面

Slide 5

Slide 5 text

©Rist Inc. 05 Conﬁdential ● 19chのEEG波形 + 心電波形の合計20chの波形データ ● EEG波形は全体で50秒間あり、ラベルはその真ん中10秒間の部分について付与される ● コンテキスト情報として、真ん中10秒以外をどう活用するか Data｜EEG波形 50秒ラベリング対象 10秒

Slide 6

Slide 6 text

©Rist Inc. 06 Conﬁdential Data｜ラベル No. クラス名説明 1 てんかん発作（Seizure）てんかん発作に伴う異常放電 2 側方化周期放電（LPD）右脳 / 左脳どちらかの領域での周期的なスパイク 3 全身性周期放電（GPD）右脳 / 左脳両方の領域での周期的なスパイク 4 側方化律動デルタ活動（LRDA）右脳 / 左脳どちらかの領域での比較的大きな波形パターン 5 一般化律動デルタ活動（GRDA）右脳 / 左脳両方の領域での比較的大きな波形パターン 6 その他の反応（Other）信号欠損などもここに分類されるてんかんについててんかん発作を繰り返す脳の病気で、年齢、性別、人種の関係なく発病します。世界保健機関（WHO）では、てんかんは「脳の慢性疾患」で、脳の神経細胞（ニューロン）に突然発生する激しい電気的な興奮により繰り返す発作を特徴とし、それに様々な臨床症状や検査での異常が伴う病気と定義されています。引用：https://www.tenkan.info/about/epilepsy/ 右脳 / 左脳 → 複数chの信号を比較する波形パターン → ラベル部分けでなく　周辺情報も見る

Slide 7

Slide 7 text

©Rist Inc. 07 Conﬁdential Data｜ラベル ● サンプルによっては、ラベル付において専門家間でも意見が別れる場合がある ● 今回のデータは1 ~ 28人のアノテーター（サンプルによって人数は変わる）の投票結果 (の比率) がGT 正規化 1. 複数人のアノテーターで独立にラベル付 2. 実際の予測対象はラベル比率分布を当てる必要がある！

Slide 8

Slide 8 text

©Rist Inc. 08 Conﬁdential Data｜アノテーション方法 (正解データがどう作られているか) 1. 10分のspectrogramで概形を確認 2. 10秒間のEEG波形を確認し、クラス分類実際のアノテーション画面

Slide 9

Slide 9 text

©Rist Inc. 09 Conﬁdential Data｜アノテーター人数の分布 ● データごとに何人でラベル付けしてるか見てみると... アノテーター人数 (vote_num) のヒストグラム明らかに2つの集団に分かれている ...🤔 ● ホストが以前データセット構築した時の論文を調査 ● その際はvote_num>=10をtest setとしていた　（大人数でラベル付したデータの方が、ラベルの　信頼性が高いため） ● その他の調査から、今回のtest setもおそらくほぼ vote_num>=10で構成されてそう、ということがわかった vote_num>=10のデータに対してﬁtするモデルを作るとスコアが上がりそう！

Slide 10

Slide 10 text

©Rist Inc. 010 Conﬁdential Data｜ここまでのまとめ ● ラベルがつけられる領域(10s) と周辺領域 (50s) ● 複数chでのスパイクの同期 / 非同期が大事 ● アノテーションでは、最初に10分間の荒いスペクトログラムで概形を確認して、その後見たい領域 (10s) にフォーカスしてラベルをつけている ● どうやらアノテーション数に偏りがあり、特に大人数でつけられているデータに対する予測精度が大事らしい ○ （それでなくとも、少人数でつけたサンプルはラベルノイズが多いはず）データの傾向が掴めるとモデルの方向性がわかる

Slide 11

Slide 11 text

©Rist Inc. 011 Conﬁdential 弊チームの解法紹介

Slide 12

Slide 12 text

©Rist Inc. 012 Conﬁdential 全体 ● 入力データ ○ 10sだけでなく50sまで含めてモデルに入力 (コンテキスト情報の利用) ○ アノテーションに倣って、10分間の荒いスペクトログラムも入力に加える ● モデルの学習戦略 ○ vote_num>=10に対してﬁttingしたい ■ vote_num>=10のデータで学習 ■ そうすると捨てるデータが増えてしまいもったいない... ● ノイズの多い vote_num<10のデータは事前学習につかう ● チームでの取り組み方 ○ 各自でパイプラインを組み、お互い良かった(効いた)点を取り込みながらモデルを育てていく ○ 最終的には3人分のモデルを合わせて大規模なensemble (モデルの予測値を混ぜる)

Slide 13

Slide 13 text

©Rist Inc. 013 Conﬁdential 詳細｜前処理 ● フィルタリング処理に気をつかう： ○ 60Hzノッチフィルタ(電気ノイズの除去)、0.4Hzハイパスフィルタ(低周波ノイズ除去) ○ chごとにrobust scaler ■ この辺りのフィルタリングを失敗すると、一気にモデルの学習が進まなくなる ■ 波形処理の経験豊富なメンバ (nikaido) の知見によるところが大きい ● ch同士で差分をとる： ○ 実際にアノテーターが見ている波形は下記のDouble bananaだが、他にも様々な差分の取り方を採用し、それぞれでモデルを作る (多様性確保の目的) ○ 右脳 / 左脳の同期 / 非同期の一部はここでケアできる

Slide 14

Slide 14 text

©Rist Inc. 014 Conﬁdential 詳細｜モデル 3人それぞれで異なるモデルを構築していたが、代表的なものは下記のようなもの 1. 10sの波形だけでなく、50s, 40sなど多少幅を持たせたwindowの波形も入力として加える 2. GRUなどで波形から特徴抽出し、2D wavegramとする 3. 波形から生成した上記の2D特徴を、画像AIモデルの入力とする引用：弊チームの解法詳細：https://www.kaggle.com/competitions/hms-harmful-brain-activity-classiﬁcation/discussion/4924 29 modelに関しては本当に色々な細かいテクを使ってますぜひ引用元の Discussion投稿も覗いてみてください

Slide 15

Slide 15 text

©Rist Inc. 015 Conﬁdential 詳細｜モデル Q：なぜ最終的に画像モデル？ A：今回のデータのポイントである、右脳 / 左脳の違いをうまく捉えられるから wavegram1 (h, feature_len) 1D EEG信号1 (1, wave_len) 1D特徴抽出 wavegram2 (h, feature_len) 1D EEG信号2 (1, wave_len) 1D特徴抽出 wavegram3 (h, feature_len) 1D EEG信号3 (1, wave_len) 1D特徴抽出 wavegram1 wavegram2 wavegram3 2D画像化画像モデル判定結果時間方向 ch方向このように特徴を積むことで、 - たて：一部の chでだけ放電が起きているか - よこ：周期的か否かが一目でわかる

Slide 16

Slide 16 text

©Rist Inc. 016 Conﬁdential コンペを振り返ってなぜ金圏に入れたか ● おそらく一番大きいのは、test setが大人数サンプルで構成されていると気づけた点 ● あとは、下記が特に貢献度が高い ○ 前処理 (ここが適切でないと、そもそも学習ができない) ○ モデル構成 (右脳 / 左脳の違いを効率よく学習する) なぜ賞金圏 (3位以内)に入れなかったか ● モデルの多様性不足 ○ 終盤で手札が尽きてしまった。普段から手札を増やす努力をすべき ○ 上位解法を見てみると、自分たちの知らない活性化関数やデータ変換の方法などが散見された ● モデルのブレンドの仕方 ○ 仮説を立てたら、ある程度のリスクを取る覚悟で積極的な方法も採用するべきだった ○ 上位チームでは、vote_num>=10にさらにﬁtさせるために積極的なmodel stackingなどを利用していた