$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
170
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
kaggle 実験管理術 v2.0 w/ claude code(レポジトリ公開)
sugupoko
0
110
関西Kaggler会_交流会_in_Osaka2025#1
sugupoko
0
20
【gensparkお試し、内容未確認】kaggle Bird+ CLEF2025解法まとめ
sugupoko
0
110
【GenSparkお試し】kaggle CMI3 overview
sugupoko
0
220
20250515_今更ながら2023年に参加したHuBMAP金ソリューションを綺麗にまとめ
sugupoko
0
200
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
890
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
950
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
2.5k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
1
700
Other Decks in Research
See All in Research
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
2
890
[論文紹介] Intuitive Fine-Tuning
ryou0634
0
150
Combining Deep Learning and Street View Imagery to Map Smallholder Crop Types
satai
3
270
When Learned Data Structures Meet Computer Vision
matsui_528
1
1.3k
SNLP2025:Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
220
生成AI による論文執筆サポート・ワークショップ ─ サーベイ/リサーチクエスチョン編 / Workshop on AI-Assisted Paper Writing Support: Survey/Research Question Edition
ks91
PRO
0
120
投資戦略202508
pw
0
580
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
970
Language Models Are Implicitly Continuous
eumesy
PRO
0
350
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
190
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification
satai
3
270
湯村研究室の紹介2025 / yumulab2025
yumulab
0
230
Featured
See All Featured
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Navigating Team Friction
lara
191
16k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Music & Morning Musume
bryan
46
7k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.2k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.6k
What's in a price? How to price your products and services
michaelherold
246
13k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.3k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー