銀_検出コンペ_202206_signate_くずしじコンペ

サマリー • 参加コンペ： – 凸版印刷株式会社くずし字認識チャレンジ① | SIGNATE -
Data Science Competition • 順位： – 12位（シルバー） • 備考： – 情報公開ポリシーがキビシイコンペ。 – モデルも分析結果も公開NGなので、言える範囲だけ。

データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •
難しかったところ – 歪みへの対応 • 補正処理を加えた、２段階のアルゴで対応 – 様々なページへの対応 • オープンデータを見てもらうと分かるが、絵が含んでいたり、文字が小さかったりする。 – 日本古典籍データセット | ROIS-DS人文学オープンデータ共同利用センター – 本コンペでもここのデータを使ってるようです。 – 実装 • Signateが用意したサーバーで動作するように記述するのが大変。

アプローチ • アルゴ – YOLOv5による検出＋補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。

所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー

銀_検出コンペ_202206_signate_くずしじコンペ

銀_検出コンペ_202206_signate_くずしじコンペ

suguuuuuすぐー

More Decks by suguuuuuすぐー

Other Decks in Research

Featured

Transcript

サマリー • 参加コンペ： – 凸版印刷株式会社くずし字認識チャレンジ① | SIGNATE -

データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •

アプローチ • アルゴ – YOLOv5による検出＋補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。

所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー

銀_検出コンペ_202206_signate_くずしじコンペ

銀_検出コンペ_202206_signate_くずしじコンペ

suguuuuuすぐー

More Decks by suguuuuuすぐー

Other Decks in Research

Featured

Transcript

サマリー • 参加コンペ： – 凸版印刷株式会社 くずし字認識チャレン ジ① | SIGNATE -

データ、タスク概要 • データ・ルール特徴 – 古文書の列検出するコンペ – アノテーションはポリゴンで設定 • 若干ゆがんでる。 •

アプローチ • アルゴ – YOLOv5による検出＋補正処理 • 学習パラメータなどは、データを用いて得られた知見に含まれるためごめんなさい。

所感 • アルゴに関して、言いたいが言えないルールなのがもどかしい – 非公開のコンペは機械学習分野の発展に貢献してない気がするなー

サマリー • 参加コンペ： – 凸版印刷株式会社くずし字認識チャレンジ① | SIGNATE -