23回アルゴリズムコンテスト 1位解法

Slide 1

Slide 1 text

ճΞϧΰϦζϜίϯςετ Ґ ղ๏ ஜ೾େֶ ৘ใֶ܈ ৘ใՊֶྨ ೥ ஜ೾େֶώϡʔϚϯίϯϐϡςʔγϣϯݚڀࣨ ॴଐ OBPLJLBUTVSB!IDPNQDTUTVLVCBBDKQ ܡ ঘً 13.6ݚڀձ!େ෼େֶ

Slide 2

Slide 2 text

ίϯςετ֓ཁ ίϯςετͷظؒɿ d ʢϲ݄ʣ ՝୊಺༰ɿ ( + 48 & + 3!%!% '(")accuracy* + $#+ 119,997 &#+ 16,387 1+ 388,146

Slide 3

Slide 3 text

લॲཧ

Slide 4

Slide 4 text

લॲཧ 標準正規分布の確率密度関数を[-1, 1]の区間で等間隔でサンプリングしたベクトル。二値化画像を横に合計を取ったベクトルを見ると、文字部分は山状になっている。

Slide 5

Slide 5 text

Ϟσϧͷશମ૾

Slide 6

Slide 6 text

݁Ռ 手元で評価（ Cross validation ）した時の認識率は、 ResNet < OctConv ResNet < DenseNet < Inception-v4 < SE-ResNeXt となった。モデル認識率 OctConv ResNet50( 事前学習無し ) 89.59% SE-ResNeXt101( 事前学習有り ) 90.23% アンサンブル (SE-ResNeXt, DenseNet, Inception-v4) 90.63% 順位最終結果のスコア 1 位 90.63% 2 位 89.35% 3 位 88.95%

Slide 7

Slide 7 text

޻෉఺ Random CropやRandom Shiftといった基本的な Augmentationに加え、分割位置に対してロバストになるように前処理によって得られた分割位置を学習時にランダムで上下に少しずれるような処理を行なった。また、学習率のスケジューリングをWarmupとRestart有りCosine Annealingにすることで収束速度と精度が共に向上した。

Slide 8

Slide 8 text

࣮ݧઃఆ ࠷ऴతʹ͸ɺϞσϧͷΞϯαϯϒϧʢՃॏฏۉʣͨ͠΋ͷ͕࠷ߴਫ਼౓ͱͳͬͨɻϞσϧ͸ɺಛ௃ྔந ग़Λߦ͏CBDLCPOF͕ҟͳΔ͚ͩͰ͋Γɺ͜ΕΒ͸શͯ*NBHF/FUͰࣄલֶश͞Ε͍ͯΔɻ ˔ CBDLCPOFɿ 4&3FT/F9U %FOTF/FU *ODFQUJPOW ˔ ଛࣦؔ਺ɿ $SPTT&OUSPQZ-PTT ˔ όοναΠζɿ ˔ ࠷దԽؔ਺ɿ NPNFOUVN4(%ʢNPNFOUVN XFJHIUEFDBZʣ ˔ εέδϡʔϥɿ 4(%3ʢMSɿd FQPDIDZDMFʣ ˔ ೖྗղ૾౓ɿY ˔ FQPDI਺ɿ ˔ (16ɿ 5FTMBW (# (59 (# ˔ ͦͷଞɿ.JYFE1SFDJTJPOͰֶश

Slide 9

Slide 9 text

·ͱΊ ● モデルは、特徴量抽出器としてImageNet等で成果を出しているCNNアーキテクチャ、クラス分類器としては、隣接した画像の特徴を考慮するためにGRUを使用したネットワークを結合した構成。 ● 前処理では、大津の二値化をしようして、良さそうな分割位置を推定。 ● 分割位置に対してモデルがロバストに学習できるように学習時にランダムで位置を変化させる。 ● 学習率をSGDRで変化させると大幅に精度と収束速度が上昇。 ● 最も精度が高くなったモデルは、SE-ResNeXt, DenseNet, Inception-v4をアンサンブルさせたモデル。コードは公開しております。 https://github.com/katsura-jp/alcon23