Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
170
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
【gensparkお試し、内容未確認】kaggle Bird+ CLEF2025解法まとめ
sugupoko
0
83
【GenSparkお試し】kaggle CMI3 overview
sugupoko
0
160
20250515_今更ながら2023年に参加したHuBMAP金ソリューションを綺麗にまとめ
sugupoko
0
180
20250413_湘南kaggler会_音声認識で使うのってメルス・・・なんだっけ?
sugupoko
1
850
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
870
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
2.2k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
1
680
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
1
250
銀_kaggle_火山コンペ_20230615
sugupoko
1
650
Other Decks in Research
See All in Research
Vision and LanguageからのEmbodied AIとAI for Science
yushiku
PRO
1
520
単施設でできる臨床研究の考え方
shuntaros
0
2.6k
最適決定木を用いた処方的価格最適化
mickey_kubo
4
1.8k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
0
150
ストレス計測方法の確立に向けたマルチモーダルデータの活用
yurikomium
0
1.4k
Type Theory as a Formal Basis of Natural Language Semantics
daikimatsuoka
1
280
問いを起点に、社会と共鳴する知を育む場へ
matsumoto_r
PRO
0
600
【輪講資料】Moshi: a speech-text foundation model for real-time dialogue
hpprc
3
640
Learning to (Learn at Test Time): RNNs with Expressive Hidden States
kurita
0
160
引力・斥力を制御可能なランダム部分集合の確率分布
wasyro
0
230
時系列データに対する解釈可能な 決定木クラスタリング
mickey_kubo
2
920
最適化と機械学習による問題解決
mickey_kubo
0
170
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
49
14k
Balancing Empowerment & Direction
lara
3
610
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
111
20k
Unsuck your backbone
ammeep
671
58k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
186
54k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
53
2.9k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
The Invisible Side of Design
smashingmag
301
51k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
How to train your dragon (web standard)
notwaldorf
96
6.2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.6k
Bash Introduction
62gerente
615
210k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー