Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
23回アルゴリズムコンテスト 1位解法
Search
catla
December 19, 2019
Research
6
670
23回アルゴリズムコンテスト 1位解法
2019年12月19日に大分大学で開かれたPRMU研究会における発表資料になります。
catla
December 19, 2019
Tweet
Share
More Decks by catla
See All by catla
ベイズ深層学習(6.3)
catla
2
220
ベイズ深層学習(6.2)
catla
3
230
[読み会資料] Federated Learning for Vision-and-Language Grounding Problems
catla
0
280
ベイズ深層学習(5.1~5.2)
catla
0
220
ベイズ深層学習(4.1)
catla
0
440
ベイズ深層学習(3.3~3.4)
catla
18
11k
ベイズ深層学習(2.2~2.4)
catla
6
1.3k
Learning Lightweight Lane Detection CNNs by Self Attention Distillation(ICCV2019)の紹介
catla
0
560
TGS Salt Identification Challenge 12th place solution
catla
3
11k
Other Decks in Research
See All in Research
Combinatorial Search with Generators
kei18
0
220
CSP: Self-Supervised Contrastive Spatial Pre-Training for Geospatial-Visual Representations
satai
3
200
ノンパラメトリック分布表現を用いた位置尤度場周辺化によるRTK-GNSSの整数アンビギュイティ推定
aoki_nosse
0
320
Agentic AIとMCPを利用したサービス作成入門
mickey_kubo
0
200
LLM-as-a-Judge: 文章をLLMで評価する@教育機関DXシンポ
k141303
3
800
GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization
satai
3
220
研究テーマのデザインと研究遂行の方法論
hisashiishihara
5
1.4k
定性データ、どう活かす? 〜定性データのための分析基盤、はじめました〜 / How to utilize qualitative data? ~We have launched an analysis platform for qualitative data~
kaminashi
6
1k
Vision And Languageモデルにおける異なるドメインでの継続事前学習が性能に与える影響の検証 / YANS2024
sansan_randd
1
100
ASSADS:ASMR動画に合わせて撫でられる感覚を提示するシステムの開発と評価 / ec75-shimizu
yumulab
1
360
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
420
言語モデルによるAI創薬の進展 / Advancements in AI-Driven Drug Discovery Using Language Models
tsurubee
2
370
Featured
See All Featured
Gamification - CAS2011
davidbonilla
81
5.3k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.3k
Documentation Writing (for coders)
carmenintech
71
4.9k
Facilitating Awesome Meetings
lara
54
6.4k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
The Invisible Side of Design
smashingmag
299
51k
Site-Speed That Sticks
csswizardry
10
640
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
47
2.8k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
4
160
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
910
Transcript
ճΞϧΰϦζϜίϯςετ Ґ ղ๏ ஜେֶ ใֶ܈ ใՊֶྨ ஜେֶώϡʔϚϯίϯϐϡςʔγϣϯݚڀࣨ ॴଐ OBPLJLBUTVSB!IDPNQDTUTVLVCBBDKQ
ܡ ঘً 13.6ݚڀձ!େେֶ
ίϯςετ֓ཁ ίϯςετͷظؒɿ d ʢϲ݄ʣ ՝༰ɿ ( + 48 &
+ 3!%!% '(")accuracy* + $#+ 119,997 &#+ 16,387 1+ 388,146
લॲཧ
લॲཧ 標準正規分布の確率密度関数 を[-1, 1]の区間で等間隔で サンプリングしたベクトル。 二値化画像を横に合計を取っ たベクトルを見ると、文字部 分は山状になっている。
Ϟσϧͷશମ૾
݁Ռ 手元で評価( Cross validation )した時の認識率は、 ResNet < OctConv ResNet <
DenseNet < Inception-v4 < SE-ResNeXt となった。 モデル 認識率 OctConv ResNet50( 事前学習無し ) 89.59% SE-ResNeXt101( 事前学習有り ) 90.23% アンサンブル (SE-ResNeXt, DenseNet, Inception-v4) 90.63% 順位 最終結果のスコア 1 位 90.63% 2 位 89.35% 3 位 88.95%
Random CropやRandom Shiftといった基本的な Augmentationに加え、分割位置に対してロバストにな るように前処理によって得られた分割位置を学習時にラ ンダムで上下に少しずれるような処理を行なった。 また、学習率のスケジューリングをWarmupとRestart有 りCosine Annealingにすることで収束速度と精度が共に
向上した。
࣮ݧઃఆ ࠷ऴతʹɺϞσϧͷΞϯαϯϒϧʢՃॏฏۉʣͨ͠ͷ͕࠷ߴਫ਼ͱͳͬͨɻϞσϧɺಛྔந ग़Λߦ͏CBDLCPOF͕ҟͳΔ͚ͩͰ͋Γɺ͜ΕΒશͯ*NBHF/FUͰࣄલֶश͞Ε͍ͯΔɻ ˔ CBDLCPOFɿ 4&3FT/F9U %FOTF/FU *ODFQUJPOW ˔ ଛࣦؔɿ
$SPTT&OUSPQZ-PTT ˔ όοναΠζɿ ˔ ࠷దԽؔɿ NPNFOUVN4(%ʢNPNFOUVN XFJHIUEFDBZʣ ˔ εέδϡʔϥɿ 4(%3ʢMSɿd FQPDIDZDMFʣ ˔ ೖྗղ૾ɿY ˔ FQPDIɿ ˔ (16ɿ 5FTMBW (# (59 (# ˔ ͦͷଞɿ.JYFE1SFDJTJPOͰֶश
·ͱΊ • モデルは、特徴量抽出器としてImageNet等で成果を出しているCNNアーキテクチャ、クラス分類 器としては、隣接した画像の特徴を考慮するためにGRUを使用したネットワークを結合した構成。 • 前処理では、大津の二値化をしようして、良さそうな分割位置を推定。 • 分割位置に対してモデルがロバストに学習できるように学習時にランダムで位置を変化させる。 • 学習率をSGDRで変化させると大幅に精度と収束速度が上昇。
• 最も精度が高くなったモデルは、SE-ResNeXt, DenseNet, Inception-v4をアンサンブルさせたモ デル。 コードは公開しております。 https://github.com/katsura-jp/alcon23