Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
180
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
kaggle 実験管理術 v2.0 w/ claude code(レポジトリ公開)
sugupoko
0
180
関西Kaggler会_交流会_in_Osaka2025#1
sugupoko
0
33
【gensparkお試し、内容未確認】kaggle Bird+ CLEF2025解法まとめ
sugupoko
0
110
【GenSparkお試し】kaggle CMI3 overview
sugupoko
0
230
20250515_今更ながら2023年に参加したHuBMAP金ソリューションを綺麗にまとめ
sugupoko
0
200
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
900
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
970
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
2.6k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
2
710
Other Decks in Research
See All in Research
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.3k
音声感情認識技術の進展と展望
nagase
0
430
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
460
ドメイン知識がない領域での自然言語処理の始め方
hargon24
1
230
離散凸解析に基づく予測付き離散最適化手法 (IBIS '25)
taihei_oki
PRO
1
650
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
120
Open Gateway 5GC利用への期待と不安
stellarcraft
2
170
Multi-Agent Large Language Models for Code Intelligence: Opportunities, Challenges, and Research Directions
fatemeh_fard
0
120
HoliTracer:Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery
satai
3
460
長期・短期メモリを活用したエージェントの個別最適化
isidaitc
0
390
Can AI Generated Ambrotype Chain the Aura of Alternative Process? In SIGGRAPH Asia 2024 Art Papers
toremolo72
0
120
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
65
35k
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
200
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
54
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
110
Site-Speed That Sticks
csswizardry
13
1k
A designer walks into a library…
pauljervisheath
210
24k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.1k
Into the Great Unknown - MozCon
thekraken
40
2.2k
AI: The stuff that nobody shows you
jnunemaker
PRO
1
160
The SEO Collaboration Effect
kristinabergwall1
0
320
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
44
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー