Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
銀_検出コンペ_202206_signate_くずしじコンペ
Search
suguuuuuすぐー
October 27, 2022
Research
0
130
銀_検出コンペ_202206_signate_くずしじコンペ
signateのくずしじコンペに参加したレポートです。
https://signate.jp/competitions/580
suguuuuuすぐー
October 27, 2022
Tweet
Share
More Decks by suguuuuuすぐー
See All by suguuuuuすぐー
20250307_kaggle_CZIIコンペ振り返り_関西Kaggler会_交流会_in_Osaka_2025#1
sugupoko
1
360
20240803_関東kaggler会_HMS振り返り&チームで取り組むkaggle
sugupoko
1
1.7k
202309 kaggle 銀 LLM science exam まとめ資料
sugupoko
1
620
金_kaggle_hubmap_202307_instance-segmenataion
sugupoko
1
200
銀_kaggle_火山コンペ_20230615
sugupoko
1
570
反省_kaggle_時系列データ_202305_手話コンペ
sugupoko
1
480
10位_202304_超解像コンペ_solafune_衛星画像の超解像
sugupoko
1
200
銀_202302_kaggle_NFL_Player_contact_detection
sugupoko
1
150
銀_1D時系列データ分類_202212_nishika_睡眠コンペ
sugupoko
1
390
Other Decks in Research
See All in Research
ナレッジプロデューサーとしてのミドルマネージャー支援 - MIMIGURI「知識創造室」の事例の考察 -
chiemitaki
0
250
Weekly AI Agents News!
masatoto
32
58k
AWS 音声基盤モデル トーク解析AI MiiTelの音声処理について
ken57
0
170
The many faces of AI and the role of mathematics
gpeyre
1
1.7k
新規のC言語処理系を実装することによる 組込みシステム研究にもたらす価値 についての考察
zacky1972
1
340
Poster: Feasibility of Runtime-Neutral Wasm Instrumentation for Edge-Cloud Workload Handover
chikuwait
0
430
Sosiaalisen median katsaus 03/2025 + tekoäly
hponka
0
350
移動ビッグデータに基づく地理情報の埋め込みベクトル化
tam1110
0
260
Weekly AI Agents News! 12月号 プロダクト/ニュースのアーカイブ
masatoto
0
350
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
1
150
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
1
1.1k
資産間の相関関係を頑健に評価する指標を用いたファクターアローケーション戦略の構築
nomamist
0
160
Featured
See All Featured
Practical Orchestrator
shlominoach
186
10k
Building Your Own Lightsaber
phodgson
104
6.3k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
480
BBQ
matthewcrist
87
9.5k
Git: the NoSQL Database
bkeepers
PRO
429
65k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
How STYLIGHT went responsive
nonsquared
99
5.4k
The Cost Of JavaScript in 2023
addyosmani
48
7.6k
Measuring & Analyzing Core Web Vitals
bluesmoon
6
290
Producing Creativity
orderedlist
PRO
344
40k
Stop Working from a Prison Cell
hatefulcrawdad
268
20k
Transcript
サマリー • 参加コンペ: – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -
Data Science Competition • 順位: – 12位(シルバー) • 備考: – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言え る範囲だけ。
データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、2段階のアルゴで 対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、 絵が含んでいたり、文字が小さかったり する。 – 日本古典籍データセット | ROIS-DS人文 学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作す るように記述するのが大変。
アプローチ • アルゴ – YOLOv5による検出+補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。
所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー