数独ではじめるアルゴリズム第三章 OCR

数独ではじめるアルゴリズム第三章 OCR Ryosuke Uchiyama step63r

グラフ構造と深さ優先探索（DFS） 0 1 2 3 4 11 5 8 6
7 9 10 12 13 14 前回のあらすじ

入れられる数字の選択肢が少ないマスから埋めていく 3 6 5 4 8 7 9 4 5
1 9 7 3 5 6 8 9 6 5 4 4 6 5 5 6 5 3 5 3 4 5 6 5 3 4 4 4 6 5 5 5 4 4 5 5 5 4 4 5 5 5 4 7 3 3 4 3 4 4 5 6 4 4 5 6 5 4 4 6 4 5 7 7 4 6 7 7 5 6 6 8 問題入れられる数字の残数ここから処理するよりも… この辺から処理した方が速い！前回のあらすじ

一意に決まるマスはあらかじめ埋めておく 3 6 5 4 8 7 9 4 5
1 9 7 3 5 6 8 9 問題 5 8 3 6 5 4 8 7 5 9 4 6 5 9 1 5 9 7 3 5 6 8 5 9 5 前処理後の問題前回のあらすじ

MVVMパターン View ViewModel Model データバインディングコマンドメソッド呼出しプロパティ設定変更通知
変更通知前回のあらすじ

Xamarin.Forms Shared C# Backend Shared UI Code iOS Android Windows
前回のあらすじ

今後やること • UI実装（WPFかXamarinあたり） • モバイル対応（iOSアプリをビルドする環境がない……つらたん……） • OCR（問題をカメラで撮ってAzure Cognitive Servicesとかで盤面認識＆自動解答） •
マルチスレッド（たぶんやらないやつ）前回のあらすじ

数字の検出

Computer Visionを用いたテキスト抽出問題発生！

Text = "3", BoundingBox = [ (115, 16), (133, 17),
(132, 39), (114, 38)] どのマスにどの数字が入るんだ……？数独のマスも検出する必要があった！

マスの検出

どんなフレームワークが使えるか案１ Azure Cognitive Servicesの既存モデルを活用案２ Custom Visionに独自モデルをデプロイ案３画像解析ライブラリで交点検出
「数独のマスを検出するAPI」があるわけないので却下。学習（データ採取）が面倒くさすぎるので却下。 PythonとOpenCVで似たようなことをやったことがあるな？１）Harrisのコーナー検出 → 精度イマイチ２）Shi-Tomasiのコーナー検出 → 精度イマイチ３）Canny → いけそう！採用採用

XamarinでどうやってOpenCVを使うか Windows ランタイムコンポーネント - UWP applications | Microsoft Docs

Microsoftは神か？ OpenCV でのビットマップの処理 - UWP applications | Microsoft Docs 問題発生！

cv::Mat Platform::Collections::Vector マネージ/ネイティブ間のマーシャリング結局、フレーム検出機能はPythonで実装することに

つくったもの

ソースコード SudokuApp uchi-sudokuapp-functions

全体構成 SudokuApp ローカルストレージ OpenFileAsync RandamAccessStream Function App Cognitive Services DetectSudokuFrame
JSON Response Stream IList<ReadResult>

数独ではじめるアルゴリズム第三章 OCR

数独ではじめるアルゴリズム第三章 OCR

Ryosuke Uchiyama

More Decks by Ryosuke Uchiyama

Other Decks in Programming

Featured

Transcript

数独ではじめるアルゴリズム第三章 OCR Ryosuke Uchiyama step63r

グラフ構造と深さ優先探索（DFS） 0 1 2 3 4 11 5 8 6

入れられる数字の選択肢が少ないマスから埋めていく 3 6 5 4 8 7 9 4 5

一意に決まるマスはあらかじめ埋めておく 3 6 5 4 8 7 9 4 5

MVVMパターン View ViewModel Model データバインディングコマンドメソッド呼出しプロパティ設定変更通知

Xamarin.Forms Shared C# Backend Shared UI Code iOS Android Windows

今後やること • UI実装（WPFかXamarinあたり） • モバイル対応（iOSアプリをビルドする環境がない……つらたん……） • OCR（問題をカメラで撮ってAzure Cognitive Servicesとかで盤面認識＆自動解答） •

数字の検出

Computer Visionを用いたテキスト抽出問題発生！

Text = "3", BoundingBox = [ (115, 16), (133, 17),

マスの検出

どんなフレームワークが使えるか案１ Azure Cognitive Servicesの既存モデルを活用案２ Custom Visionに独自モデルをデプロイ案３画像解析ライブラリで交点検出

XamarinでどうやってOpenCVを使うか Windows ランタイムコンポーネント - UWP applications | Microsoft Docs

Microsoftは神か？ OpenCV でのビットマップの処理 - UWP applications | Microsoft Docs 問題発生！

cv::Mat Platform::Collections::Vector マネージ/ネイティブ間のマーシャリング結局、フレーム検出機能はPythonで実装することに

つくったもの

ソースコード SudokuApp uchi-sudokuapp-functions

全体構成 SudokuApp ローカルストレージ OpenFileAsync RandamAccessStream Function App Cognitive Services DetectSudokuFrame

Demo

数独ではじめるアルゴリズム 第三章 OCR

数独ではじめるアルゴリズム 第三章 OCR

More Decks by Ryosuke Uchiyama

Other Decks in Programming

Featured

Transcript

数独ではじめるアルゴリズム第三章 OCR

数独ではじめるアルゴリズム第三章 OCR