Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI-OCRはどうやって文字を読み取るのか

hikiaki
September 12, 2019

 AI-OCRはどうやって文字を読み取るのか

hikiaki

September 12, 2019
Tweet

More Decks by hikiaki

Other Decks in Technology

Transcript

  1. #RPALT Whatʼs asilla? 画像認識技術を中⼼とした ソリューションを開発・提供する AIスタートアップ企業。 【第⼀回⼈⼯知能EXPO】株式会社アジラの⾏動認識技術デモ 2017年6⽉ 第⼀回⼈⼯知能EXPOに 「⾏動認識技術」を出展

    2018年10⽉ ⼿書き⽂字OCRを 「AIビジネス展2018」 にて発表 2019年度、 経産省の【J-Startup】 に選定していただきました。 特許番号 6525181 ⾏動推定装置 特許番号 6525180 対象数特定装置 特許番号 6525179 ⾏動推定装置(背景) ⼿書き・活字に対応の AI-OCR【ジジラ】SaaS版を 2019年7⽉リリース。 ⾏動認識技術に関する特許を取得し、 画像認識技術に関する特許も出願準備中 Presented by 各種⼿書き帳票・活字帳票を読み取り、 テキスト化する⽂字認識ソリューション
  2. #RPALT ジジラは4ステップで実⾏ Presented by 読み取りたい帳票の画像 を準備します 帳票画像の準備 読み取りたい帳票画像を アップロードします 読み取り結果がテキスト

    化されます 帳票画像の アップロード 読み取り 読み取り結果は、確認画⾯ で修正できます 確認した結果はCSV形式で ダウンロードできます 補正と ダウンロード テンプレートに使⽤する 帳票を登録し、読み取る 位置と項⽬を設定します テンプレートの 登録
  3. #RPALT AI-OCRが⽂字を読み取れる訳 Presented by 学習データ=画像データ 教師データ=テキストデータ 2019 8840 070 12

    022 15 画像データと答えである 教師データを⾒ながら ⾃動で⽂字の特徴を捉える ※画像はイメージです
  4. #RPALT AI-OCRが⽂字を読み取れる訳 Presented by 2019 8840 070 12 022 15

    0は丸? 1は縦線に 似てる? 9は上に 丸がある? 8は上下に 丸が2つ並んでる? 学習中…Training… 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
  5. #RPALT もし学習データに間違いがあったら Presented by 2919 8840 079 12 092 15

    間違えた特徴を 捉えてしまう 丸が1個あったら9? c 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
  6. #RPALT 学習データに間違いがなくても Presented by 198-8041 0 R60年12⽉30⽇ 15 学習データに共通点(特徴)が ない場合、AIは混乱します

    5 8と0の違いが わからない? 5の共通点が ない? 0だけど6 みたい? 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです