Upgrade to Pro — share decks privately, control downloads, hide ads and more …

190920 OCR廻り 小ネタ集 石井さん

RPABANK
September 20, 2019

190920 OCR廻り 小ネタ集 石井さん

RPABANK

September 20, 2019
Tweet

More Decks by RPABANK

Other Decks in Technology

Transcript

  1. OCR廻り
    小ネタ集

    View Slide

  2. ● OCR用にFAXを受信する
    ● フォルダーに原稿が投げ込まれたらOCRする
    ● OCRを買わずにOCRする
    ● PDFの一部をマスキングする
    ● PDFの一部の画像を切り出して保存する
    ● RPAからFAXする
    お題

    View Slide

  3. システム構成
    FAX
    受信フォルダ OCR
    監視
    処理
    読み取り
    テキスト
    データ
    格納
    RPA
    基幹
    システム
    受注管理システムなど
    失敗フォルダ
    成功フォルダ
    受信
    手修正
    ユーザ作業
    発注書など


    3

    View Slide

  4. ● OCR用にFAXを受信する
    FAX
    受信
    フォルダ
    格納
    受信
    既存
    紙 OCRするものだけ選り
    分けたい
    ● FAX回線を増設する
    ● 複合機を増設する
    ● 1台の複合機で複数のFAX回線を受信できる
    ● 現在の紙出力・フォルダ保存に加えて別のフォルダーに格納できる
    ● 受信ファイル名に発信者番号を付与できる
    ● OCRに都合の良い解像度・ファイル形式に変更

    View Slide

  5. ● フォルダーに原稿が投げ込まれたらOCRする
    ○ RPAで
    ○ タスクスケジューラ+RPAで
    ○ タスクスケジューラ+PowerShellで
    ○ フォルダー監視用ソフトで
    ○ OCRのフォルダー監視機能で

    View Slide

  6. ● OCRを買わずにOCRする
    GoogleCloudVision
    PDFファイルをOCRする機能
    RPAから呼ぶことは可能(めんどい)
    結果はJSON形式 → めんどい

    View Slide

  7. View Slide

  8. ● PDFの一部をマスキングして保存する
    ● PDFの一部の画像を切り出して保存する
    pdf.js を使う(JavaScript) fillrect()
    Webサーバ必要(IIS、Node.js、200OK)

    View Slide

  9. ● RPAからFAXする
    FAXドライバーを使う
    プリンタードライバー形式
    複合機に送るとプリントする代わりにFAXする
    FAX番号を指定できる

    View Slide

  10. sagamiya
    オマケ:
    トリをつとめます⇒
    日経BP総研主催 : RPA/ビジネスAIカンファレンス

    View Slide