銀_画像分類コンペ_202109_probspace 宗教画テーマの分類

Slide 1

Slide 1 text

DATE 1/xx • suguuuu

Slide 2

Slide 2 text

このコンペ活動について • スタート: – 2021/5月～メンバ3人 ⇒ 2021/7月メンバ6人 • 参加したコンペ: – パナソニック株式会社間取り図解析アルゴリズム作成 | SIGNATE - Data Science Competition – 2021/9 : 宗教画テーマの分類 | ProbSpace ←今日はこれの参加報告 Phase1 : ~2021/7 Phase2:~2021/12 Phase3 : ~2022/3 目的: 有名なNetを構築し、提出までのフローを学ぶ成果物: Tensorflow2でベースネット構築周辺ライブラリの調査提出フォーマットへの変換目的: いくつかのNetを構築し、性能改善のための施策を学ぶ kaggleを調査し、性能改善のための施策を学ぶ成果物: ・複数のNet構築・アンサンブルなどのテクニック取得目的: 効率的な検討・開発を行い、上位に入り込む成果物: ・kubeflowによる自動学習環境の構築ほぼ素人たちが、雰囲気ゆるゆるな感じで、半年くらいでコンペ上位を目指す活動です。

Slide 3

Slide 3 text

機械学習コンペとは?? • 2021/09現在openの画像系コンペ – RSNA-MICCAI Brain Tumor Radiogenomic Classification | Kaggle • MRIの画像から神経膠芽腫の遺伝的サブタイプを分類 – NFL Health & Safety - Helmet Assignment | Kaggle • NFL動画から誰のヘルメットが強い衝撃を受けたか予測 – Nishika - ケーブルコネクタの種類判別 • ケーブルが写った画像から、どのUSBのタイプ(typeC?など)が写っているかを予測目的:特定のタスクに関して、ある期間内でアルゴリズムを開発し、テストデータに対して良い精度を出す!! 神経膠芽腫の遺伝的サブタイプ分類誰のヘルメットが強い衝撃を受けたか予測どのUSBのタイプ(typeCなど) が写っているか予測

Slide 4

Slide 4 text

補足:機械学習コンペってどういう風に進めるの??? • Public Leaderboard(Public LB) – 実施期間中、テストデータの一部で評価された暫定順位表 • Private Leaderboard(Private LB) – それ以外のデータで評価された順位表。すべてのデータで評価するので順位が入れ替わる!! 実施期間中は、”Public Leaderboard”に表示される順位を見ながら着手最終順位はPrivate Leaderboardで確定 Privateで最終順位が変わる可能性！ Publicを過信せず、汎化性能が必要 Public Leaderboard（実施期間中見れる順位） Private Leaderboard（最終確定の順位）

Slide 5

Slide 5 text

今回行ったコンペの内容: 受胎告知キリストの降誕聖家族羊飼いの礼拝東方三博士の礼拝エジプトへの逃避イエスの洗礼最後の晩餐茨の冠キリストの磔刑キリストの嘆きラザロの復活最後の審判 13クラスを DNNで分類画像データから宗教画のテーマをクラス分類できるアルゴ(DNN)を開発! ＃テーマは13クラス!見るからに宗教画っぽいですね!

Slide 6

Slide 6 text

本コンペの難しかったポイント: 受胎告知キリストの降誕聖家族羊飼いの礼拝東方三博士の礼拝エジプトへの逃避イエスの洗礼最後の晩餐茨の冠キリストの磔刑キリストの嘆きラザロの復活最後の審判テーマ絵画の詳細(一例) データ数受胎告知処女マリアがキリストを妊娠したことを告げられる 60 キリストの降誕イエス・キリストが誕生する 42 聖家族幼少年時代のイエス・キリスト、養父ヨセフ、聖母マリア 132 羊飼いの礼拝イエス・キリストを目にするために羊飼いが訪れる 42 東方三博士の礼拝マリアとイエス・キリストを拝み、乳香、没役、黄金を捧げる 42 エジプトへの逃避養父ヨセフは、ヘロデ王のたくらみを避けて、マリアとともにエジプトへと逃れる 60 イエスの洗礼ヨルダン川で洗礼者ヨハネからイエスは洗礼を受ける 48 最後の晩餐イエスが処刑される前夜、十二使徒と共に食事をしている。使徒の一人が裏切者であることが告げられる 30 茨の冠笞打ちの刑となったイエスが、兵士から茨でできた冠をかぶせられあざ笑われる 30 キリストの磔刑イエスは十字架に磔となって処刑される 66 キリストの嘆きキリストの体が十字架から剥がされ、その体をイエスの友人たちが悼む 30 ラザロの復活ラザロの墓の前で、イエスが祈った直後、イエスの友人であるラザロが蘇生する 42 最後の審判再臨したイエスが死者に裁きを下し、天国と地獄へと振り分けられる 30 学習データ合計 654枚テストデータ 497枚 ①画像だけでテーマの特徴が分かりづらい・・・? ②しかもデータ数が少なく、偏りがある!!

Slide 7

Slide 7 text

今回の結果は・・・? 219チーム中、14位・・・・! ＃上位5%くらい! いやーもっといろいろやりたかったけど、時間足りねーわ ←言い訳 Kaggleでいうメダルの範囲感

Slide 8

Slide 8 text

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 8月2日 8月7日 8月12日 8月17日 8月22日 8月27日 9月1日 9月6日 9月11日スコア Public Private アプローチとスコアの変化 ①初期モデル作成交差検証の枠組み実装 ②imagenet事前学習モデル、 Augmentationの利用 150近く様々なNetを学習し、学習パラメータも大枠探索 ③学習データの偏り調整対策 1. Imbalanced samplerの利用 2. Label smootherの利用 ⑤データ不足対策事前学習をwikiartで実施時間足りずSwin-transfomer のワンモデルで最終提出 ④Augmentationの調整テストデータにあったパラメータに最適化様々な取り組みをしていくなか、大きく分けて5つの取り組みで精度が変化! ＃実は、ここに書いてない数多くの取り組みが存在しています・・・

Slide 9

Slide 9 text

②imagenet事前学習モデル、Augmentationの利用 • ②でやった内容 – ライブラリ(Pytorch Image models)にある事前学習されたバックボーンモデルをひたすら学習 • パラメータを変えつつ150近く学習を実施。 • そこそこ性能が出た、EfficientNet-B4とswin-transfomerにターゲットを絞る – Augmentationの探索 • テストデータのドメインを考慮し、ライブラリ（Albumentations）を利用 – 左右上下反転、セピア化、BrightnessContrastが精度向上に寄与 – Randam Erase、cut out、mix upとかは効果が無かった・・・ • なぜ②を行ったか – imagenet事前学習モデルの利用 • 事前学習無しの場合、データの偏りの影響をもろに受けていた – データ量が相対的に多いクラス２としか予測できない。 – Augmentationの探索 • データが少ないので、とりあえずデータを水増し ①の結果：クラス２としてしか予測できない

Slide 10

Slide 10 text

やりたかったこと • 自己教師あり学習による事前学習の強化! – 概要: • 最高性能を出しているTransfomerでも実施されている、2020年大流行りしたワークフロー • 画像データのみで、backboneの事前学習をできちゃう! – なんでやりたかったの?: • Wikiartの2クラス分類による事前学習で性能の向上があったので、これをやりたかった・・・ • たぶんえぐいほど性能出たはず・・・ – 備考: • MRIなどimagenetと大きく異なるドメインで認識させたい場合に超有効らしい • Optunaを利用したハイパーパラメータの自動探索! – 概要: • Preferred networkで開発されたハイパーパラメータ探索ツール – なんでやりたかったの?: • パラメータ探索が全然詰めれてなかった・・・ • Grad-camによる学習特性の分析 – 概要: • Explainable AIの走りだし、なんでこのクラスに分類されたかが分かるフレームワーク – なんでやりたかったの?: • どこかを注目して分類しているか、、、とかを判断したかった。なんとなく。

Slide 11

Slide 11 text

DATE 11/xx その他メモ:あとで読んでね • このコンペをやるにあたって参考にした過去のコンペ – [Kaggle]キャッサバコンペ振り返り (zenn.dev) – #11 [初心者歓迎! / 画像編] atmaCup (guruguru.science) • その他得られた知見 – モデルに応じて最適化手法が異なるぜ。（Transfomer系:SGD、CNN:Adam） – ひたすら実験を行えるような環境構築が重要。そこそこ実装できた。 – データが少ない時は、CVやLBの結果に左右されず、性能が出るハズ、、、と思う学習をさせるべし。←スライドでは触れなかったけど超重要知見 • 今回45位からshake upして14位になったのは、少量の学習・テストデータに過学習させない学習方法を取ったから。 • やってみたけど、うまく行かなかったこと – 間違えやすいラベルをまとめて、2段階で推論（2クラス分類→9クラス分類みたいな感じで多段DNN） – アンサンブルは精度が低下した。おそらくデータの偏りに耐えられなかった。（CVは性能向上したが、LBダメ） – Augmentation（mixup, cutout,Randam grid shuffle）。むずいわパラメータ探索。。。 • Albumentationsのaugmentationをひたすら動かす - Qiita – テストデータの推論結果を利用した半教師あり学習:CVは性能あがったがLBダメダメ。ワンモデルの精度が低いのでダメなのかも。 • やらなかったこと – ラベルノイズ対策:ラベルノイズは含まれてないと思うので未実施 – スタッキング:Ave.Ensemble失敗したし、挑戦してもダメそうだったのでやらなかった。そもそもワンモデルの精度低いし・・・ – AutoAug、RandAug:着手する時間無し。。。

Slide 12

Slide 12 text

DATE 12/xx Appendix

Slide 13

Slide 13 text

コンペなんて意味あるの?数％精度向上目指すだけじゃん・・・ “引き出しの広さ”と”スピード感”こそ、Kaggle人材の魅力 • Kaggleをやっている人たちに対して、「0.001ポイント程度の小さい精度を争っても意味がないのでは?」と批判をする人がいますが、実務においてわずかな精度を追求することを目的としてKagglerを集めているわけではありません。 • Kagglerの魅力は、幅広い機械学習問題への取り組み経験から得られる引き出しの広さと、限られた時間で高いレベルのアウトプットを生み出せるスピード感にあります。 • また実務では、限られた時間の中でクイックに分析結果を出して次の業務の方向性を決める必要があります。分析アウトプットを出すまでの圧倒的なスピードが、Kagglerの大きな武器であり、非常に高速な PDCAサイクルを回すことが可能です。第1回：なぜDeNAは「Kaggler」を集めているのか？ - ZDNet Japan 会社での開発は、いろんなステークホルダーに確認しながら進めなくてはいけないのでマジで遅い実力をつけるには、結果を短期間で出さなきゃいけない。つまりコンペだ!

Slide 14

Slide 14 text

会社（俺がやってた仕事）でのDNN開発と、コンペの違い（ワイ視点、弊社全体ではない） • 会社でのDNN開発:下図でいう青色のところがメイン – ニーズに合わせて、データセットの構築から入る ←ここに、ほぼほぼ工数がかかる – ぶっちゃけ、クライテリア次第でデータセットの構築でおおよその性能が満たせる – R&Dとかからベースをもらってくることが多いので、大きな変更が入れづらい。。。 – エッジ前提のため、演算規模を度外視して性能を上げるための工夫は知らなくていい。。。 • Kaggle等コンペ:下図でいう緑色のところがメイン – データセットが固定されてるため、開発の部分がメイン – 回帰問題で解くのか、などの課題に対してのアプローチを検討できる。会社では、環境構築＆データセット構築の作業がメインな感じがするコンペは、データセットが固定されてるためネットワーク、データセットの工夫がメイン DNNワークフロー概要:会社では青メイン、コンペでは緑メイン会社での DNN開発ここがメインコンペでの DNN開発ここがメイン

Slide 15

Slide 15 text

初めてコンペに取り組んで感じた難しさ • 自分の手札の少ねえ!! – データを増やす、パラメータを微調節というアプローチでしか改善させたことがなかった。。。 • 分類?回帰? • アンサンブル?TTA（test-time augmentation）?複数のモデルで? • 時間ねえ!! – 3か月あるから余裕っしょ・・・⇒やべえ、業務に時間とられて全然できないぞ、、、⇒精度出ないわ・・・ – 普通に0から学習しても行けるっしょ⇒精度出ないやん・・・⇒TF配布のモデル使って転移学習しよ⇒間に合わねえ・・・ • ライブラリわかんねえ!! – 業務ではTF1.14での学習がメインだったため、最新の知識が不足だった • Tfboard、評価のスクリプト、Augmentationのライブラリが使えるようになった! • 普通に技術分かんねえ!! – セマセグ、keypointは後処理含めて理解していたが、Bounding BOXの認識の原理の理解がなかった。。。言い訳