Upgrade to Pro — share decks privately, control downloads, hide ads and more …

190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん

190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん

190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん

RPACommunity

August 22, 2019
Tweet

More Decks by RPACommunity

Other Decks in Technology

Transcript

  1. Copyright © 2019 WingArc1st Inc. All Rights Reserved. テクニカルセールス部 敦賀

    武志 AI-OCR データ化のポイント ~ AI-OCR+記録管理+RPA=MAX(業務効率化) ~ ウイングアーク1st株式会社 #RPALT
  2. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT 紙文書の AI-OCR によるデータ化のポイント 1
  3. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化に必要なプロセス 2 ①文書のスキャン ②読み取りの前処理 ③OCR処理 ④データ連携 OCR RPA/API/ETL 電子化 (PDF・画像) 自動取込 サイズ調整 回転・傾き補正 OCRデータ化 ファイル保管 データ確認/修正 OCRデータ連携 他システム活用 データ化/活用までの流れ 登録データと 電子化ファイルの 記録管理 ⑤記録(文書)管理
  4. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ①文書のスキャン 3 紙 PDFや画像形式で紙文書を電子化 文書の電子化プロセスのポイント 【スキャナ設定】 ・解像度 200dpi/300dpi/400dpi (ファイルサイズも考慮) ・階調 カラー/モノクロ(2値またはグレースケール) ・ファイル形式 PDF/画像(TIFF, JPEG, BMPなど) 1枚を1ファイル/複数枚を1ファイル
  5. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ②読み取りの前処理 4 OCR 読み取り前処理で加工調整 OCR 精度を上げるポイント ・印刷やスキャン時の傾き補正 ・カメラ撮影時の台形補正 ・余白のオフセット補正
  6. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ③OCR 処理(1) 5 OCR OCR 処理でデータ化 OCRデータ化のポイント① ・ノイズ、罫線、網掛けなど読み取り対象により 読み取り精度に影響 ・処理エラーの検知と対応 ・完了ファイルの保管方法と運用 数値や文字(英字/ひらがな/カタカナ/漢字)、チェックボックスや 丸囲い等をデータ化
  7. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化のポイント② ③OCR 処理(2) 確認修正 6 確認・修正 OCRの読取り精度は100%ではありません!! ・認識率の高い数値やQRコード(バーコード)を利用 ・読み間違えの確認、修正の運用を検討 ・効率良く確認、修正できる機能が必要 OCR
  8. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ④データ連携 7 データ連携 ERP Package マスター データ OCR API ETL RPA OCRデータ連携のポイント OCR データを必要なシステムに連携して活用 ・連携する手段(RPA/API/ETL)を検討 ・連携するシステムに合わせてフォーマットを変更 ・元データにマスターデータなどの項目を追加
  9. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理 8 OCRデータ活用のポイント OCR 登録データ管理 +記録(文書)管理 システムに登録した記録としてのデータ OCR OCR 参照 電子化した文書の記録としてのデータ
  10. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理の事例 9 領収書と請求書の電帳法スキャナ保存 領収書 請求書 タイムスタンプ局 中継 Server 基幹 システム タイムスタンプ付与 決裁・伝票情報登録 ワークフローシステム 伝票登録 申請 アップロード 電子化 WF申請 アップロード タイムスタンプ付与 WF決裁 バッチ処理 基幹システム連携 (伝票登録) 登録データ管理 + 記録(文書)管理 決裁 バッチ処理
  11. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理の事例 10 登録データ管理 +記録(文書)管理の画面 リンクをクリック 保存されているPDFファイルを表示
  12. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 11
  13. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール + RPA = MAX(業務効率化) 12
  14. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール SPA 13 文書の自動削除 文書の自動取得 本社管理部門 支店・支社 工場拠点 営業部門 文書の検索・回覧・決済 OCR 文書のライフサイクルを管理 作成 ⇒ 処理 ⇒ 保管 ⇒ 保存 ⇒ 廃棄
  15. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の複数 OCR エンジン:読取項目ごとに選択 ABBYY 1文字ボックスの認識 オンプレ版を提供予定 辞書と文脈判断の機能 複数行の認識 200カ国以上の国で 5,000万人以上が使用 WingArc Data Capture チェックボックス 丸囲い 活字OCR 手書きOCR 手書きOCR 書 類 を デ ー タ 化 ! OCR読取データを CSVファイルでダウンロード 14
  16. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の自動仕分け機能 帳票名 日付 お客様名 請求書 TNS 2015 2016 帳票名で 判断して帳票棚へ お客様名は 省略名称を利用 注文書 経理部 取り込み用フォルダ PDFを配置 棚が無ければ自動生成 配置 同 時 に 整 理 ! 15
  17. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の RPA 活用デモンストレーション 16 電子帳票サーバー 自動化されるプロセス CSV OCR読取 データ 検索 申込書 受領 AI-OCR 自動仕分け DB RPA 原本 ウイング ツアー OCRデータ CSV出力 チェック 修正 レビュー チェック済 未連携 スキャン 検索 出力 データ 入力 入力 データ 登録 登録 連携済フラグ 更新 格納
  18. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 17
  19. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化プロセスと計測の範囲 18 手入力 SPA ①紙帳票を見なが らExcelに登録 ②紙帳票を見なが らExcelを確認 ①紙帳票を スキャナでPDF化 ②SPA取込 OCR処理 ③SPAで データ修正 ④SPAで データ確認 計測範囲 計測範囲 5ページ 5ページ
  20. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT 比較に使用したサンプル帳票A 19 項目 項目数 数字 11 英数字 2 日本語 6 チェック 2 丸囲い 4 DEEP READ使用 19 合計 25
  21. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化計測結果 サンプルA × 5ページ 20 項目 時間 備考 ①紙帳票を見ながらExcelに登録 12分57秒 ②紙帳票を見ながらExcelを確認 6分0秒 合計:①+② 18分57秒 ▪入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分9秒 OCR認識率は77% ④SPAでデータ確認 4分30秒 合計:①+③+④ 10分39秒 ②は人的工数ではない為、除外 ▪入力方法:SPA
  22. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT 比較に使用したサンプル帳票B 21 項目 項目数 英数字(鑑) 1 数字(鑑) 1 日本語(鑑) 2 数字(明細×10行) 20※ 英数字(明細×10行) 10※ 日本語(明細×10行) 10※ 合計 44※ ※明細10行全てのデータを登録した場合の最大値
  23. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化計測結果 サンプルB × 5ページ 22 項目 時間 備考 ①紙帳票を見ながらExcelに登録 9分53秒 ②紙帳票を見ながらExcelを確認 3分12秒 合計:①+② 13分5秒 ▪入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分 OCR認識率は63% ④SPAでデータ確認 2分30秒 合計:①+③+④ 8分30秒 ②は人的工数ではない為、除外 ▪入力方法:SPA
  24. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT サンプル帳票A コスト比較 23 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 18分57秒 約660円 10分39秒 約370円 5ページで125フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.1秒 約5.27円 5.1秒 約2.95円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 31時間35分 約66,000円 17時間45分 約37,000円 約14時間(45%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 63時間10分 約132,000円 35時間30分 約74,000円 約28時間(44%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 157時間55分 約330,000円 88時間45分 約185,000円 約77時間(49%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 315時間50分 約660,000円 177時間30分 約370,000円 約138時間(44%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
  25. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT サンプル帳票 B コスト比較 24 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 13分5秒 約455円 8分30秒 約295円 5ページで80フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.8秒 約5.68円 6.3秒 約3.65円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 21時間50分 約45,500円 14時間10分 約29,500円 約7時間(33%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 43時間40分 約91,000円 28時間20分 約59,000円 約13時間(30%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 109時間10分 約227,500円 70時間50分 約147,500円 約39時間(36%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 218時間20分 約455,000円 141時間40分 約295,000円 約77時間(35%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
  26. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2019 WingArc1st Inc. All Rights Reserved. #RPALT まとめ 25 AI-OCR + + 記録管理 RPA = MAX(業務効率化) 人生を豊かに幸せにする
  27. Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©

    2017 WingArc1st, Inc. All Rights Reserved. go way beyond ご清聴ありがとうございました! #RPALT