Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
160
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
【gensparkお試し、内容未確認】kaggle Bird+ CLEF2025解法まとめ
sugupoko
0
73
【GenSparkお試し】kaggle CMI3 overview
sugupoko
0
90
20250515_今更ながら2023年に参加したHuBMAP金ソリューションを綺麗にまとめ
sugupoko
0
160
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
770
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
760
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
2k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
1
660
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
1
230
銀_kaggle_火山コンペ_20230615
sugupoko
1
630
Other Decks in Research
See All in Research
データサイエンティストの就労意識~2015→2024 一般(個人)会員アンケートより
datascientistsociety
PRO
0
700
データxデジタルマップで拓く ミラノ発・地域共創最前線
mapconcierge4agu
0
180
Streamlit 総合解説 ~ PythonistaのためのWebアプリ開発 ~
mickey_kubo
1
940
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
laysakura
0
1.5k
Looking for Escorts in Sydney?
lunsophia
1
120
最適決定木を用いた処方的価格最適化
mickey_kubo
4
1.7k
rtrec@dbem6
myui
6
880
Pix2Poly: A Sequence Prediction Method for End-to-end Polygonal Building Footprint Extraction from Remote Sensing Imagery
satai
3
490
(NULLCON Goa 2025)Windows Keylogger Detection: Targeting Past and Present Keylogging Techniques
asuna_jp
1
540
データサイエンティストの採用に関するアンケート
datascientistsociety
PRO
0
1k
20250605_新交通システム推進議連_熊本都市圏「車1割削減、渋滞半減、公共交通2倍」から考える地方都市交通政策
trafficbrain
0
500
Google Agent Development Kit (ADK) 入門 🚀
mickey_kubo
2
1.1k
Featured
See All Featured
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
Code Reviewing Like a Champion
maltzj
524
40k
Agile that works and the tools we love
rasmusluckow
329
21k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.5k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
970
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.7k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Mobile First: as difficult as doing things right
swwweet
223
9.7k
A better future with KSS
kneath
238
17k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー