Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
180
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
kaggle 実験管理術 v2.0 w/ claude code(レポジトリ公開)
sugupoko
0
170
関西Kaggler会_交流会_in_Osaka2025#1
sugupoko
0
33
【gensparkお試し、内容未確認】kaggle Bird+ CLEF2025解法まとめ
sugupoko
0
110
【GenSparkお試し】kaggle CMI3 overview
sugupoko
0
230
20250515_今更ながら2023年に参加したHuBMAP金ソリューションを綺麗にまとめ
sugupoko
0
200
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
900
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
970
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
2.6k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
2
710
Other Decks in Research
See All in Research
Akamaiのキャッシュ効率を支えるAdaptSizeについての論文を読んでみた
bootjp
1
380
ACL読み会2025: Can Language Models Reason about Individualistic Human Values and Preferences?
yukizenimoto
0
110
Nullspace MPC
mizuhoaoki
1
580
LLM-jp-3 and beyond: Training Large Language Models
odashi
1
740
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
3
310
情報技術の社会実装に向けた応用と課題:ニュースメディアの事例から / appmech-jsce 2025
upura
0
290
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
460
Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities
satai
3
340
Thirty Years of Progress in Speech Synthesis: A Personal Perspective on the Past, Present, and Future
ktokuda
0
140
AWSの耐久性のあるRedis互換KVSのMemoryDBについての論文を読んでみた
bootjp
1
400
[Devfest Incheon 2025] 모두를 위한 친절한 언어모델(LLM) 학습 가이드
beomi
2
1.4k
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
390
Featured
See All Featured
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
34
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
59
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.1k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
130
How Software Deployment tools have changed in the past 20 years
geshan
0
31k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
37
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
31
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
2.8k
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Site-Speed That Sticks
csswizardry
13
1k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
42
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー