Upgrade to Pro — share decks privately, control downloads, hide ads and more …

1st Place Solution / 1st Place Solution Sansan x atmaCup #12

Sansan DSOC
December 17, 2021

1st Place Solution / 1st Place Solution Sansan x atmaCup #12

■イベント 
:Sansan x atmaCup #12 振り返り会
https://atma.connpass.com/event/229180/

■登壇概要
タイトル:1st Place Solution
発表者: Kurose (@enu_kuro) さん

▼Sansan R&D Twitter
https://twitter.com/SansanRandD

Sansan DSOC

December 17, 2021
Tweet

More Decks by Sansan DSOC

Other Decks in Technology

Transcript

  1. PROFILE Kurose (@enu_kuro) Software Engineer (仕事はiOS, Web Frontendメイン) 機械学習歴は1年半ちょっと (主にCourseraとKaggleで勉強)

    2020/1~2020/10 ほぼ無職だったのでフルタイムで取り組んでいた Andrew Ng先⽣の⼈気講座で基礎を⾝に付けKaggleに挑戦 ⾃⼰紹介
  2. 注⽬したポイント - CV, LBの⽬安 (colum2131さんのdiscussion"CV vs LB"参照) LB:0.8超えたら結構強い LBとCVに0.1くらい開きがある -

    TestにしかないClassが存在する 評価指標がクラスごとのF1 Score平均なのでスコアへの影響が⼤きい - 画像データから抽出されたデータによるテーブルデータ 画像としてデータを扱うこともできる? 最後まで本気で取り組むことを決めて⽬標設定 - 運営ベースライン(0.8147)を超える - Discussionにコメントする なんの強制⼒もなくゆるい⽬標だが、あると踏ん張りどころで背中を⼀押ししてくれることも ✓ ✓
  3. Node特徴量 - x_center - y_center - box_width - box_height 0~1に正規化を⾏った中⼼座標と縦横幅

    正規化前の縦横⽐や⾯積等いくつか特徴量追加試したが精度あまり変わらなかったので採⽤せず NNは賢いので余計なことしなくても⼤丈夫なはず... Trust NN Edge特徴量 - x_diff (Nodeのx_centerの差) - y_diff (Nodeのy_centerの差) rishigamiさんのチュートリアルの特徴量をそのまま使⽤ 特徴量選択
  4. モデルアーキテクチャ & ハイパラ調整 丸1⽇モデルのチューニングに費やす ここで初サブ LB:0.7909まで到達 10/22 PNAConv Layer *

    4 + Fully Connected Layer ⼤きめのDropout(0.8) ⼤きめの Learning Rate(5e-3) StepLR 20epochで5e-3*0.1