Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん
Search
RPACommunity
August 22, 2019
Technology
0
410
190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん
190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん
RPACommunity
August 22, 2019
Tweet
Share
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
970
201023 DX Suiteを触ってみた Ayy
rpabank
0
960
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
580
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
560
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
630
201018 RPAの本質とトレンド Mitz
rpabank
0
480
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
420
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
420
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
380
Other Decks in Technology
See All in Technology
Oracle Base Database Service:サービス概要のご紹介
oracle4engineer
PRO
1
16k
スケールし続ける事業とサービスを支える組織とアーキテクチャの生き残り戦略 / The survival strategy for Money Forward’s engineering.
moneyforward
0
240
ネットワーク可視化の世界
likr
7
5.7k
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
6
54k
OCI技術資料 : ファイル・ストレージ 概要
ocise
3
12k
ハイテク休憩
sat
PRO
2
190
Storage Browser for Amazon S3
miu_crescent
1
350
普通のエンジニアがLaravelコアチームメンバーになるまで
avosalmon
0
670
10年もののバグを退治した話
n_seki
0
140
Google Cloud で始める Cloud Run 〜AWSとの比較と実例デモで解説〜
risatube
PRO
0
140
信頼されるためにやったこと、 やらなかったこと。/What we did to be trusted, What we did not do.
bitkey
PRO
0
1.6k
12 Days of OpenAIから読み解く、生成AI 2025年のトレンド
shunsukeono_am
0
1k
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.1k
KATA
mclloyd
29
14k
Adopting Sorbet at Scale
ufuk
74
9.1k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Scaling GitHub
holman
459
140k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
Designing for humans not robots
tammielis
250
25k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
3
340
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
Product Roadmaps are Hard
iamctodd
PRO
50
11k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
365
25k
Transcript
Copyright © 2019 WingArc1st Inc. All Rights Reserved. テクニカルセールス部 敦賀
武志 AI-OCR データ化のポイント ~ AI-OCR+記録管理+RPA=MAX(業務効率化) ~ ウイングアーク1st株式会社 #RPALT
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT 紙文書の AI-OCR によるデータ化のポイント 1
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化に必要なプロセス 2 ①文書のスキャン ②読み取りの前処理 ③OCR処理 ④データ連携 OCR RPA/API/ETL 電子化 (PDF・画像) 自動取込 サイズ調整 回転・傾き補正 OCRデータ化 ファイル保管 データ確認/修正 OCRデータ連携 他システム活用 データ化/活用までの流れ 登録データと 電子化ファイルの 記録管理 ⑤記録(文書)管理
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ①文書のスキャン 3 紙 PDFや画像形式で紙文書を電子化 文書の電子化プロセスのポイント 【スキャナ設定】 ・解像度 200dpi/300dpi/400dpi (ファイルサイズも考慮) ・階調 カラー/モノクロ(2値またはグレースケール) ・ファイル形式 PDF/画像(TIFF, JPEG, BMPなど) 1枚を1ファイル/複数枚を1ファイル
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ②読み取りの前処理 4 OCR 読み取り前処理で加工調整 OCR 精度を上げるポイント ・印刷やスキャン時の傾き補正 ・カメラ撮影時の台形補正 ・余白のオフセット補正
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ③OCR 処理(1) 5 OCR OCR 処理でデータ化 OCRデータ化のポイント① ・ノイズ、罫線、網掛けなど読み取り対象により 読み取り精度に影響 ・処理エラーの検知と対応 ・完了ファイルの保管方法と運用 数値や文字(英字/ひらがな/カタカナ/漢字)、チェックボックスや 丸囲い等をデータ化
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化のポイント② ③OCR 処理(2) 確認修正 6 確認・修正 OCRの読取り精度は100%ではありません!! ・認識率の高い数値やQRコード(バーコード)を利用 ・読み間違えの確認、修正の運用を検討 ・効率良く確認、修正できる機能が必要 OCR
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ④データ連携 7 データ連携 ERP Package マスター データ OCR API ETL RPA OCRデータ連携のポイント OCR データを必要なシステムに連携して活用 ・連携する手段(RPA/API/ETL)を検討 ・連携するシステムに合わせてフォーマットを変更 ・元データにマスターデータなどの項目を追加
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理 8 OCRデータ活用のポイント OCR 登録データ管理 +記録(文書)管理 システムに登録した記録としてのデータ OCR OCR 参照 電子化した文書の記録としてのデータ
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理の事例 9 領収書と請求書の電帳法スキャナ保存 領収書 請求書 タイムスタンプ局 中継 Server 基幹 システム タイムスタンプ付与 決裁・伝票情報登録 ワークフローシステム 伝票登録 申請 アップロード 電子化 WF申請 アップロード タイムスタンプ付与 WF決裁 バッチ処理 基幹システム連携 (伝票登録) 登録データ管理 + 記録(文書)管理 決裁 バッチ処理
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理の事例 10 登録データ管理 +記録(文書)管理の画面 リンクをクリック 保存されているPDFファイルを表示
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 11
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール + RPA = MAX(業務効率化) 12
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール SPA 13 文書の自動削除 文書の自動取得 本社管理部門 支店・支社 工場拠点 営業部門 文書の検索・回覧・決済 OCR 文書のライフサイクルを管理 作成 ⇒ 処理 ⇒ 保管 ⇒ 保存 ⇒ 廃棄
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の複数 OCR エンジン:読取項目ごとに選択 ABBYY 1文字ボックスの認識 オンプレ版を提供予定 辞書と文脈判断の機能 複数行の認識 200カ国以上の国で 5,000万人以上が使用 WingArc Data Capture チェックボックス 丸囲い 活字OCR 手書きOCR 手書きOCR 書 類 を デ ー タ 化 ! OCR読取データを CSVファイルでダウンロード 14
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の自動仕分け機能 帳票名 日付 お客様名 請求書 TNS 2015 2016 帳票名で 判断して帳票棚へ お客様名は 省略名称を利用 注文書 経理部 取り込み用フォルダ PDFを配置 棚が無ければ自動生成 配置 同 時 に 整 理 ! 15
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の RPA 活用デモンストレーション 16 電子帳票サーバー 自動化されるプロセス CSV OCR読取 データ 検索 申込書 受領 AI-OCR 自動仕分け DB RPA 原本 ウイング ツアー OCRデータ CSV出力 チェック 修正 レビュー チェック済 未連携 スキャン 検索 出力 データ 入力 入力 データ 登録 登録 連携済フラグ 更新 格納
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 17
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化プロセスと計測の範囲 18 手入力 SPA ①紙帳票を見なが らExcelに登録 ②紙帳票を見なが らExcelを確認 ①紙帳票を スキャナでPDF化 ②SPA取込 OCR処理 ③SPAで データ修正 ④SPAで データ確認 計測範囲 計測範囲 5ページ 5ページ
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT 比較に使用したサンプル帳票A 19 項目 項目数 数字 11 英数字 2 日本語 6 チェック 2 丸囲い 4 DEEP READ使用 19 合計 25
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化計測結果 サンプルA × 5ページ 20 項目 時間 備考 ①紙帳票を見ながらExcelに登録 12分57秒 ②紙帳票を見ながらExcelを確認 6分0秒 合計:①+② 18分57秒 ▪入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分9秒 OCR認識率は77% ④SPAでデータ確認 4分30秒 合計:①+③+④ 10分39秒 ②は人的工数ではない為、除外 ▪入力方法:SPA
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT 比較に使用したサンプル帳票B 21 項目 項目数 英数字(鑑) 1 数字(鑑) 1 日本語(鑑) 2 数字(明細×10行) 20※ 英数字(明細×10行) 10※ 日本語(明細×10行) 10※ 合計 44※ ※明細10行全てのデータを登録した場合の最大値
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化計測結果 サンプルB × 5ページ 22 項目 時間 備考 ①紙帳票を見ながらExcelに登録 9分53秒 ②紙帳票を見ながらExcelを確認 3分12秒 合計:①+② 13分5秒 ▪入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分 OCR認識率は63% ④SPAでデータ確認 2分30秒 合計:①+③+④ 8分30秒 ②は人的工数ではない為、除外 ▪入力方法:SPA
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT サンプル帳票A コスト比較 23 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 18分57秒 約660円 10分39秒 約370円 5ページで125フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.1秒 約5.27円 5.1秒 約2.95円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 31時間35分 約66,000円 17時間45分 約37,000円 約14時間(45%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 63時間10分 約132,000円 35時間30分 約74,000円 約28時間(44%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 157時間55分 約330,000円 88時間45分 約185,000円 約77時間(49%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 315時間50分 約660,000円 177時間30分 約370,000円 約138時間(44%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT サンプル帳票 B コスト比較 24 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 13分5秒 約455円 8分30秒 約295円 5ページで80フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.8秒 約5.68円 6.3秒 約3.65円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 21時間50分 約45,500円 14時間10分 約29,500円 約7時間(33%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 43時間40分 約91,000円 28時間20分 約59,000円 約13時間(30%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 109時間10分 約227,500円 70時間50分 約147,500円 約39時間(36%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 218時間20分 約455,000円 141時間40分 約295,000円 約77時間(35%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT まとめ 25 AI-OCR + + 記録管理 RPA = MAX(業務効率化) 人生を豊かに幸せにする
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2017 WingArc1st, Inc. All Rights Reserved. go way beyond ご清聴ありがとうございました! #RPALT