Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
23回アルゴリズムコンテスト 1位解法
Search
catla
December 19, 2019
Research
6
660
23回アルゴリズムコンテスト 1位解法
2019年12月19日に大分大学で開かれたPRMU研究会における発表資料になります。
catla
December 19, 2019
Tweet
Share
More Decks by catla
See All by catla
ベイズ深層学習(6.3)
catla
2
210
ベイズ深層学習(6.2)
catla
3
210
[読み会資料] Federated Learning for Vision-and-Language Grounding Problems
catla
0
260
ベイズ深層学習(5.1~5.2)
catla
0
220
ベイズ深層学習(4.1)
catla
0
430
ベイズ深層学習(3.3~3.4)
catla
18
11k
ベイズ深層学習(2.2~2.4)
catla
6
1.3k
Learning Lightweight Lane Detection CNNs by Self Attention Distillation(ICCV2019)の紹介
catla
0
550
TGS Salt Identification Challenge 12th place solution
catla
3
11k
Other Decks in Research
See All in Research
地理空間情報と自然言語処理:「地球の歩き方旅行記データセット」の高付加価値化を通じて
hiroki13
1
190
한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성
inureyes
PRO
0
220
複数データセットを用いた動作認識
yuyay
0
110
AWS 音声基盤モデル トーク解析AI MiiTelの音声処理について
ken57
0
130
渋谷Well-beingアンケート調査結果
shibuyasmartcityassociation
0
400
Leveraging LLMs for Unsupervised Dense Retriever Ranking (SIGIR 2024)
kampersanda
2
300
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
460
Composed image retrieval for remote sensing
satai
2
240
非ガウス性と非線形性に基づく統計的因果探索
sshimizu2006
0
540
Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications
satai
2
150
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1.3k
Large Vision Language Model (LVLM) に関する最新知見まとめ (Part 1)
onely7
24
5.9k
Featured
See All Featured
Docker and Python
trallard
44
3.3k
Documentation Writing (for coders)
carmenintech
67
4.6k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
10
1.3k
It's Worth the Effort
3n
184
28k
Visualization
eitanlees
146
15k
Optimising Largest Contentful Paint
csswizardry
34
3.1k
Designing for Performance
lara
604
68k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Side Projects
sachag
452
42k
Transcript
ճΞϧΰϦζϜίϯςετ Ґ ղ๏ ஜେֶ ใֶ܈ ใՊֶྨ ஜେֶώϡʔϚϯίϯϐϡςʔγϣϯݚڀࣨ ॴଐ OBPLJLBUTVSB!IDPNQDTUTVLVCBBDKQ
ܡ ঘً 13.6ݚڀձ!େେֶ
ίϯςετ֓ཁ ίϯςετͷظؒɿ d ʢϲ݄ʣ ՝༰ɿ ( + 48 &
+ 3!%!% '(")accuracy* + $#+ 119,997 &#+ 16,387 1+ 388,146
લॲཧ
લॲཧ 標準正規分布の確率密度関数 を[-1, 1]の区間で等間隔で サンプリングしたベクトル。 二値化画像を横に合計を取っ たベクトルを見ると、文字部 分は山状になっている。
Ϟσϧͷશମ૾
݁Ռ 手元で評価( Cross validation )した時の認識率は、 ResNet < OctConv ResNet <
DenseNet < Inception-v4 < SE-ResNeXt となった。 モデル 認識率 OctConv ResNet50( 事前学習無し ) 89.59% SE-ResNeXt101( 事前学習有り ) 90.23% アンサンブル (SE-ResNeXt, DenseNet, Inception-v4) 90.63% 順位 最終結果のスコア 1 位 90.63% 2 位 89.35% 3 位 88.95%
Random CropやRandom Shiftといった基本的な Augmentationに加え、分割位置に対してロバストにな るように前処理によって得られた分割位置を学習時にラ ンダムで上下に少しずれるような処理を行なった。 また、学習率のスケジューリングをWarmupとRestart有 りCosine Annealingにすることで収束速度と精度が共に
向上した。
࣮ݧઃఆ ࠷ऴతʹɺϞσϧͷΞϯαϯϒϧʢՃॏฏۉʣͨ͠ͷ͕࠷ߴਫ਼ͱͳͬͨɻϞσϧɺಛྔந ग़Λߦ͏CBDLCPOF͕ҟͳΔ͚ͩͰ͋Γɺ͜ΕΒશͯ*NBHF/FUͰࣄલֶश͞Ε͍ͯΔɻ ˔ CBDLCPOFɿ 4&3FT/F9U %FOTF/FU *ODFQUJPOW ˔ ଛࣦؔɿ
$SPTT&OUSPQZ-PTT ˔ όοναΠζɿ ˔ ࠷దԽؔɿ NPNFOUVN4(%ʢNPNFOUVN XFJHIUEFDBZʣ ˔ εέδϡʔϥɿ 4(%3ʢMSɿd FQPDIDZDMFʣ ˔ ೖྗղ૾ɿY ˔ FQPDIɿ ˔ (16ɿ 5FTMBW (# (59 (# ˔ ͦͷଞɿ.JYFE1SFDJTJPOͰֶश
·ͱΊ • モデルは、特徴量抽出器としてImageNet等で成果を出しているCNNアーキテクチャ、クラス分類 器としては、隣接した画像の特徴を考慮するためにGRUを使用したネットワークを結合した構成。 • 前処理では、大津の二値化をしようして、良さそうな分割位置を推定。 • 分割位置に対してモデルがロバストに学習できるように学習時にランダムで位置を変化させる。 • 学習率をSGDRで変化させると大幅に精度と収束速度が上昇。
• 最も精度が高くなったモデルは、SE-ResNeXt, DenseNet, Inception-v4をアンサンブルさせたモ デル。 コードは公開しております。 https://github.com/katsura-jp/alcon23