Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
170
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
kaggle 実験管理術 v2.0 w/ claude code(レポジトリ公開)
sugupoko
0
150
関西Kaggler会_交流会_in_Osaka2025#1
sugupoko
0
31
【gensparkお試し、内容未確認】kaggle Bird+ CLEF2025解法まとめ
sugupoko
0
110
【GenSparkお試し】kaggle CMI3 overview
sugupoko
0
230
20250515_今更ながら2023年に参加したHuBMAP金ソリューションを綺麗にまとめ
sugupoko
0
200
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
900
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
950
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
2.6k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
2
710
Other Decks in Research
See All in Research
GPUを利用したStein Particle Filterによる点群6自由度モンテカルロSLAM
takuminakao
0
700
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
5
920
論文紹介:Not All Tokens Are What You Need for Pretraining
kosuken
1
220
学習型データ構造:機械学習を内包する新しいデータ構造の設計と解析
matsui_528
5
2.2k
[IBIS 2025] 深層基盤モデルのための強化学習驚きから理論にもとづく納得へ
akifumi_wachi
19
9k
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
4
400
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
220
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification
satai
3
350
令和最新技術で伝統掲示板を再構築: HonoX で作る型安全なスレッドフロート型掲示板 / かろっく@calloc134 - Hono Conference 2025
calloc134
0
450
スキマバイトサービスにおける現場起点でのデザインアプローチ
yoshioshingyouji
0
270
財務諸表監査のための逐次検定
masakat0
0
210
国際論文を出そう!ICRA / IROS / RA-L への論文投稿の心構えとノウハウ / RSJ2025 Luncheon Seminar
koide3
12
6.5k
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.1k
We Are The Robots
honzajavorek
0
120
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
110
Ruling the World: When Life Gets Gamed
codingconduct
0
100
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.4k
Evolving SEO for Evolving Search Engines
ryanjones
0
73
A designer walks into a library…
pauljervisheath
210
24k
Building an army of robots
kneath
306
46k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
28
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
74
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー