Upgrade to Pro — share decks privately, control downloads, hide ads and more …

201207 クラウドじゃなくてもAI-OCRは使えます 森さん

comucal
December 07, 2020

201207 クラウドじゃなくてもAI-OCRは使えます 森さん

comucal

December 07, 2020
Tweet

More Decks by comucal

Other Decks in Technology

Transcript

  1. #RPALT SPECIAL EDITION オンプレミスのAI-OCRだと ・FAXなどにみられるノイズによる誤読 ・帳票読み取り位置のずれ(主にFAX)同じ帳票でも印刷位置がずれている ・帳票フォーマットの微妙な違い ・帳票画像の種類 一般的にはPDFが多い。Jpeg、pngなどもある。 Tiff画像は縦横で解像度が変わっているものもあるため変換等かけないと

    読めないケースもある →帳票単位での細かなチューニングを⾏うことができる →基準となる読み取り位置を設定することでズレに対応できる →画像振り分け等による対応もできたりする(カモ) →画像の読み取り時に変換をかける。他のツールを使って画像調整したのちに 処理を⾏うなど様々な対応をとることができる
  2. #RPALT SPECIAL EDITION AIが誤読する場合は学習が必要 コレハ 「ツ」 ナンヤデ♪ 「シ」 トチャウネンデ 文字の特徴やポイントなどを

    ディープラーニングによって把 握します。 これは 「ツ」 です AI-OCRのAI 文字を学習する方法は概ね同じ。文字のパターンを学習させることで誤読を減らしていく。 クラウドサービスでは提供側にて学習が⾏われているがオンプレミスの場合は自分たちで⾏わな いといけない。
  3. #RPALT SPECIAL EDITION コレハ 「ツ」 ヤデ ディープラーニング 後は文字を認識でき るようになります。 AI-OCR

    AIが誤読する場合は学習が必要 学習することで読み取り精度が向上する。
  4. #RPALT SPECIAL EDITION AIREADの⼿書き文字学習 機械学習 閲覧・編集 AIRead Train Studio HW

    教師データ (文字切取り画像) 読取り帳票画像データ 編集後データ ⼿書き モデル 教師データを追加学習 専用の学習ツールも併せて提供 ユーザ単位で独自の学習モデルを作ることができる。
  5. #RPALT SPECIAL EDITION AIREADの活字学習 活字 モデル 頻出単語やフォントデータ を追加学習 AIRead Train

    Studio 頻出単語等をフォントデータ活字モデルに対して追加学習を⾏う。
  6. #RPALT SPECIAL EDITION イメージ その他 RPA、EAI AIRead Form Editor AIRead

    Rule Editor 帳票定義 作成 画像処理 帳票仕分け OCR 確認 CSV出⼒ システム 連携
  7. #RPALT SPECIAL EDITION AIREADでできる事 ざっくりこんなことできますよっと︕ 回転、傾き補正機能 帳票の拡大、縮小機能 色の強調・除去機能 罫線除去機能 画像内のキーワードによる帳票仕分け

    画像イメージによる帳票仕分け OCR キーワード 抽出・仕分け 印影(赤色)を除去 A 社 B 社 C 社 D 社 A B C A 画像 マッチング 仕分け 画像データ 画像データ CSVデータ A B C A 画像データ ≪回転補正≫ 90°180°270° ≪傾き補正≫ ±1〜45° OCR A社 B社 C社 D社 200 dpi 400 dpi 画像内の 最大矩形で 拡大・縮小 解像度が違う画像 300 dpi 画質を一致 OCR 300 dpi
  8. #RPALT SPECIAL EDITION AIREADでできる事 ざっくりこんなことできますよっと︕ 読取位置のずれを補正 フリーピッチ・複数⾏の⼿書き文字の読み取り チェックマークや〇囲みの読み取り 定型・非定型どちらかの指定でCSV出⼒ 罫線を区切りとしCSV形式で出⼒

    全文OCRでテキスト形式で出⼒ 実際の帳票で 位置ずれした場合 文字に合わせて 位置を補正 罫線に合わせて 位置を補正 希望する true 本店 true 支店 false 東京都千代田区霞が 関3-2-5霞ヶ関ビル 機密保持契約 アライズイノベーション株式会社(以下「甲」と いう)と〇〇株式会社(以下「乙」という)は、 以下のとおり合意し、契約(以下「本契約」とい う)を締結する。 第1条(目的) 本契約は、乙がAI-OCRの導入を検討する(乙が甲 に委託するシステムの概念実証業務を含み、以下 「本件業務」という)にあたり、甲乙間で相互に 開示される機密情報および個人情報に関する取り 扱い、保護、管理を定めることを目的とする。 第2条(機密情報および個人情報の定義) 1.本契約において、機密情報とは、本件業務の 遂⾏にあたり甲および乙が開示する業務上、技術 上のすべての情報をいう。 座標を指定し出⼒ (定型) ルールを指定し出⼒ (非定型)
  9. #RPALT SPECIAL EDITION • アライズイノベーション株式会社(https://www.ariseinnovation.co.jp/) • 東京都中央区勝どき3-13-1 • TEL :

    03-5534-9967 ※”AIRead”のロゴ及び商品名はアライズイノベーション株式会社の登録商標です(特許庁登録第6029981号)