Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん
Search
RPACommunity
August 22, 2019
Technology
0
410
190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん
190822 AI-OCRデータ化のポイント ウイングアーク1st 敦賀さん
RPACommunity
August 22, 2019
Tweet
Share
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
960
201023 DX Suiteを触ってみた Ayy
rpabank
0
950
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
570
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
550
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
620
201018 RPAの本質とトレンド Mitz
rpabank
0
470
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
420
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
410
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
380
Other Decks in Technology
See All in Technology
日経電子版のStoreKit2フルリニューアル
shimastripe
1
150
Introduction to Works of ML Engineer in LY Corporation
lycorp_recruit_jp
0
150
SAP Community and Developer Update
sygyzmundovych
0
350
なぜ今 AI Agent なのか _近藤憲児
kenjikondobai
4
1.4k
安心してください、日本語使えますよ―Ubuntu日本語Remix提供休止に寄せて― 2024-11-17
nobutomurata
1
1k
Platform Engineering for Software Developers and Architects
syntasso
1
530
AGIについてChatGPTに聞いてみた
blueb
0
130
【Startup CTO of the Year 2024 / Audience Award】アセンド取締役CTO 丹羽健
niwatakeru
0
1.4k
Mastering Quickfix
daisuzu
1
300
OCI 運用監視サービス 概要
oracle4engineer
PRO
0
4.8k
電話を切らさない技術 電話自動応答サービスを支える フロントエンド
barometrica
1
170
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.9k
Featured
See All Featured
XXLCSS - How to scale CSS and keep your sanity
sugarenia
246
1.3M
[RailsConf 2023] Rails as a piece of cake
palkan
52
4.9k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
Teambox: Starting and Learning
jrom
133
8.8k
Ruby is Unlike a Banana
tanoku
97
11k
Typedesign – Prime Four
hannesfritz
40
2.4k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Done Done
chrislema
181
16k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Making Projects Easy
brettharned
115
5.9k
Statistics for Hackers
jakevdp
796
220k
Transcript
Copyright © 2019 WingArc1st Inc. All Rights Reserved. テクニカルセールス部 敦賀
武志 AI-OCR データ化のポイント ~ AI-OCR+記録管理+RPA=MAX(業務効率化) ~ ウイングアーク1st株式会社 #RPALT
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT 紙文書の AI-OCR によるデータ化のポイント 1
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化に必要なプロセス 2 ①文書のスキャン ②読み取りの前処理 ③OCR処理 ④データ連携 OCR RPA/API/ETL 電子化 (PDF・画像) 自動取込 サイズ調整 回転・傾き補正 OCRデータ化 ファイル保管 データ確認/修正 OCRデータ連携 他システム活用 データ化/活用までの流れ 登録データと 電子化ファイルの 記録管理 ⑤記録(文書)管理
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ①文書のスキャン 3 紙 PDFや画像形式で紙文書を電子化 文書の電子化プロセスのポイント 【スキャナ設定】 ・解像度 200dpi/300dpi/400dpi (ファイルサイズも考慮) ・階調 カラー/モノクロ(2値またはグレースケール) ・ファイル形式 PDF/画像(TIFF, JPEG, BMPなど) 1枚を1ファイル/複数枚を1ファイル
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ②読み取りの前処理 4 OCR 読み取り前処理で加工調整 OCR 精度を上げるポイント ・印刷やスキャン時の傾き補正 ・カメラ撮影時の台形補正 ・余白のオフセット補正
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ③OCR 処理(1) 5 OCR OCR 処理でデータ化 OCRデータ化のポイント① ・ノイズ、罫線、網掛けなど読み取り対象により 読み取り精度に影響 ・処理エラーの検知と対応 ・完了ファイルの保管方法と運用 数値や文字(英字/ひらがな/カタカナ/漢字)、チェックボックスや 丸囲い等をデータ化
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT OCRデータ化のポイント② ③OCR 処理(2) 確認修正 6 確認・修正 OCRの読取り精度は100%ではありません!! ・認識率の高い数値やQRコード(バーコード)を利用 ・読み間違えの確認、修正の運用を検討 ・効率良く確認、修正できる機能が必要 OCR
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ④データ連携 7 データ連携 ERP Package マスター データ OCR API ETL RPA OCRデータ連携のポイント OCR データを必要なシステムに連携して活用 ・連携する手段(RPA/API/ETL)を検討 ・連携するシステムに合わせてフォーマットを変更 ・元データにマスターデータなどの項目を追加
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理 8 OCRデータ活用のポイント OCR 登録データ管理 +記録(文書)管理 システムに登録した記録としてのデータ OCR OCR 参照 電子化した文書の記録としてのデータ
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理の事例 9 領収書と請求書の電帳法スキャナ保存 領収書 請求書 タイムスタンプ局 中継 Server 基幹 システム タイムスタンプ付与 決裁・伝票情報登録 ワークフローシステム 伝票登録 申請 アップロード 電子化 WF申請 アップロード タイムスタンプ付与 WF決裁 バッチ処理 基幹システム連携 (伝票登録) 登録データ管理 + 記録(文書)管理 決裁 バッチ処理
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT ⑤記録(文書)管理の事例 10 登録データ管理 +記録(文書)管理の画面 リンクをクリック 保存されているPDFファイルを表示
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 11
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール + RPA = MAX(業務効率化) 12
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT AI-OCR 搭載文書管理ツール SPA 13 文書の自動削除 文書の自動取得 本社管理部門 支店・支社 工場拠点 営業部門 文書の検索・回覧・決済 OCR 文書のライフサイクルを管理 作成 ⇒ 処理 ⇒ 保管 ⇒ 保存 ⇒ 廃棄
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の複数 OCR エンジン:読取項目ごとに選択 ABBYY 1文字ボックスの認識 オンプレ版を提供予定 辞書と文脈判断の機能 複数行の認識 200カ国以上の国で 5,000万人以上が使用 WingArc Data Capture チェックボックス 丸囲い 活字OCR 手書きOCR 手書きOCR 書 類 を デ ー タ 化 ! OCR読取データを CSVファイルでダウンロード 14
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の自動仕分け機能 帳票名 日付 お客様名 請求書 TNS 2015 2016 帳票名で 判断して帳票棚へ お客様名は 省略名称を利用 注文書 経理部 取り込み用フォルダ PDFを配置 棚が無ければ自動生成 配置 同 時 に 整 理 ! 15
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT SPA の RPA 活用デモンストレーション 16 電子帳票サーバー 自動化されるプロセス CSV OCR読取 データ 検索 申込書 受領 AI-OCR 自動仕分け DB RPA 原本 ウイング ツアー OCRデータ CSV出力 チェック 修正 レビュー チェック済 未連携 スキャン 検索 出力 データ 入力 入力 データ 登録 登録 連携済フラグ 更新 格納
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT デモンストレーション 17
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化プロセスと計測の範囲 18 手入力 SPA ①紙帳票を見なが らExcelに登録 ②紙帳票を見なが らExcelを確認 ①紙帳票を スキャナでPDF化 ②SPA取込 OCR処理 ③SPAで データ修正 ④SPAで データ確認 計測範囲 計測範囲 5ページ 5ページ
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT 比較に使用したサンプル帳票A 19 項目 項目数 数字 11 英数字 2 日本語 6 チェック 2 丸囲い 4 DEEP READ使用 19 合計 25
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化計測結果 サンプルA × 5ページ 20 項目 時間 備考 ①紙帳票を見ながらExcelに登録 12分57秒 ②紙帳票を見ながらExcelを確認 6分0秒 合計:①+② 18分57秒 ▪入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分9秒 OCR認識率は77% ④SPAでデータ確認 4分30秒 合計:①+③+④ 10分39秒 ②は人的工数ではない為、除外 ▪入力方法:SPA
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT 比較に使用したサンプル帳票B 21 項目 項目数 英数字(鑑) 1 数字(鑑) 1 日本語(鑑) 2 数字(明細×10行) 20※ 英数字(明細×10行) 10※ 日本語(明細×10行) 10※ 合計 44※ ※明細10行全てのデータを登録した場合の最大値
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT データ化計測結果 サンプルB × 5ページ 22 項目 時間 備考 ①紙帳票を見ながらExcelに登録 9分53秒 ②紙帳票を見ながらExcelを確認 3分12秒 合計:①+② 13分5秒 ▪入力方法:手入力 項目 時間 備考 ①紙帳票をスキャナでPDF化 5秒 紙のセットと機械のボタン操作 ②SPA取込OCR処理 5秒 タイマー時間+SPAログより ③SPAでデータ修正 6分 OCR認識率は63% ④SPAでデータ確認 2分30秒 合計:①+③+④ 8分30秒 ②は人的工数ではない為、除外 ▪入力方法:SPA
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT サンプル帳票A コスト比較 23 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 18分57秒 約660円 10分39秒 約370円 5ページで125フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.1秒 約5.27円 5.1秒 約2.95円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 31時間35分 約66,000円 17時間45分 約37,000円 約14時間(45%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 63時間10分 約132,000円 35時間30分 約74,000円 約28時間(44%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 157時間55分 約330,000円 88時間45分 約185,000円 約77時間(49%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 315時間50分 約660,000円 177時間30分 約370,000円 約138時間(44%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT サンプル帳票 B コスト比較 24 項目 手入力 SPA 備考 ① 5ページ登録確認の 時間(上段)とコスト(下段) 13分5秒 約455円 8分30秒 約295円 5ページで80フィールド ② 1フィールド毎の登録確認の 時間(上段)とコスト(下段) 9.8秒 約5.68円 6.3秒 約3.65円 ③ 500ページ登録確認の 時間(上段)とコスト(下段) 21時間50分 約45,500円 14時間10分 約29,500円 約7時間(33%) の作業時間削減 ④ 1000ページ登録確認の 時間(上段)とコスト(下段) 43時間40分 約91,000円 28時間20分 約59,000円 約13時間(30%) の作業時間削減 ⑤ 2500ページ登録確認の 時間(上段)とコスト(下段) 109時間10分 約227,500円 70時間50分 約147,500円 約39時間(36%) の作業時間削減 ⑥ 5000ページ登録確認の 時間(上段)とコスト(下段) 218時間20分 約455,000円 141時間40分 約295,000円 約77時間(35%) の作業時間削減 人的コストは時給2,100円(0.58円/1秒)で計算 ※1 ※1 時給額は厚生労働省資料「平成29年度 労働者派遣事業報告書の集計結果_報道発表資料全体版.pdf」P.8「表7派遣料金(その1)」 “31” “事務用機器操作員”の平成 29年度派遣労働者平均料金である 16,482円 を元に算出しています。
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2019 WingArc1st Inc. All Rights Reserved. #RPALT まとめ 25 AI-OCR + + 記録管理 RPA = MAX(業務効率化) 人生を豊かに幸せにする
Copyright © 2019 WingArc1st Inc. All Rights Reserved. Copyright ©
2017 WingArc1st, Inc. All Rights Reserved. go way beyond ご清聴ありがとうございました! #RPALT