Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
200204 AIReadって知ってます? アライズイノベーション株式会社 森さん
Search
RPACommunity
February 04, 2020
Technology
0
170
200204 AIReadって知ってます? アライズイノベーション株式会社 森さん
200204 AIReadって知ってます? アライズイノベーション株式会社 森さん
RPACommunity
February 04, 2020
Tweet
Share
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
930
201023 DX Suiteを触ってみた Ayy
rpabank
0
920
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
560
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
510
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
580
201018 RPAの本質とトレンド Mitz
rpabank
0
440
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
390
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
390
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
340
Other Decks in Technology
See All in Technology
元インフラエンジニアに成る / Human Resources to Human Relations
bobtani
4
890
Algyan イベント振り返り
linyixian
0
200
Hands-on Gemini, the Google DeepMind LLM
meteatamel
1
110
推しは推せるときに推せ! プロダクトにフィードバックしていこう
nakasho
0
240
レガシーをぶっ壊せ。AEONで始めるDevRelの話 / Qiita Night 2024-2-22
aeonpeople
3
1.2k
Azure犬駆動開発の記録/GlobalAzureFukuoka2024_20240420
nina01
1
180
Java EE/Jakarta EEの現状と将来―クラウドネイティブ時代にJava EEは対応できるのか?―
takakiyo
1
120
Meta Quest 3 で動く桜マシマシ WebXR アプリを IBM Cloud Code Engine と Babylon.js で作った話
1ftseabass
PRO
0
120
コンパウンドスタートアップのためのスケーラブルでセキュアなInfrastructure as Codeパイプラインを考える / Scalable and Secure Infrastructure as Code Pipeline for a Compound Startup
yuyatakeyama
3
4.6k
HEXA OSINT CTF V3 作戦会議
meow_noisy
0
120
Reducing Cross-Zone Egress at Spotify with Custom gRPC Load Balancing Recap
koh_naga
0
180
Next'24 事例セッションの紹介とクラウド資格を活用したキャリア形成について語りMuscle
yasumuusan
1
420
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
501
140k
Faster Mobile Websites
deanohume
298
30k
Bootstrapping a Software Product
garrettdimon
PRO
301
110k
Agile that works and the tools we love
rasmusluckow
324
20k
Infographics Made Easy
chrislema
238
18k
Building Better People: How to give real-time feedback that sticks.
wjessup
354
18k
The Art of Programming - Codeland 2020
erikaheidi
41
12k
Rails Girls Zürich Keynote
gr2m
91
13k
How to name files
jennybc
64
93k
Thoughts on Productivity
jonyablonski
57
3.8k
How To Stay Up To Date on Web Technology
chriscoyier
782
250k
WebSockets: Embracing the real-time Web
robhawkes
59
7k
Transcript
#RPALT AIReadって知ってます? アライズイノベーション株式会社 森 康晴
#RPALT 自己紹介 森 康晴 アライズイノベーション株式会社 プリセールスやってますが一応技術者です。
AI-OCR(まれにRPA)のお仕事やってます。 あず 蘭丸 つながってやっても いいよという方はぜひ
#RPALT AI-OCRで思われがちなこと どんな帳票でもフォームとか自動で判断して読み取ってくれる! 手書き文字も100%読み取ってくれる! 入力作業が完全自動化!(RPAと連携で) まだそこまでたどりつけてない・・・・ ごめん、これも無理
100%はなかなか、なぁ・・・・・
#RPALT AI-OCRが苦手なこと ⚫ 一つの帳票内でレイアウトが異なる ⚫ ページを跨いでいる帳票 こんな感じ で時々変わ るやつとか ページまたいでるやつとか
ちゃんとレイアウトは合わせてください。 AI-OCRはその辺りはあまりおりこうさんではないのです。
#RPALT じゃぁ、AI-OCRのAIってなんなん? コレハ 「シ」 デス AI-OCR
#RPALT AI-OCRのAIはこんなん!! コレハ 「ツ」 ナンヤデ♪ 「シ」 トチャウネンデ 文字の特徴やポイントなどを ディープラーニングによって把 握します。
これは 「ツ」 です AI-OCRのAI
#RPALT AI-OCRのAIはこんなん!! 豊日自動車 タブン 「豊田自動車」ヤロ マチガッテルヤン シャーナイカラ ナオシトイタルワ こんな感じで予測変換など で間違って書かれたものを
修正してくれたりします。 コレハ 「ツ」 ヤデ ディープラーニング 後は文字を認識でき るようになります。 AI-OCR AI-OCR
#RPALT そもそもAI-OCRの役割ってなんでしょうか? 手書き帳票・活字帳票をデータ化することより 入力作業を補完するものです。 入力作業を完全に取って代わってくれるわけではなかったりします。 なんでか? 読取率が100%じゃないんだもん。 ちょっとは間違えちゃうしね。
#RPALT AI-OCR導入前 入力とチェックする人たち RPA
#RPALT AI-OCR導入後 チェックする人たち RPA AI-OCRでデータ化
#RPALT AI-OCRのサービスでは クラウドでのサービスが主になっています。 クラウドだとサーバを用意したりとかいろいろ手間なことから解放されますよね。 サーバのお守もしなくていいし、やめたくなったらいつでもやめられる。 でも、クラウドサービスでと言われるといろいろ課題があったりするケースも あったりしませんか?
#RPALT クラウドサービスで言われがちなこと 登録したデータのセキュリティは大丈夫か? クラウド上に個人情報なんてあげられへんわ。 登録したデータはどう管理されてるのか明らかにしてほしい。 そもそもクラウドにつなげないんですけど・・・。
データ化したいけど社外に書類を出すな!!と言われた。 とかとか、いうことも多いのではないでしょうか。 クラウドサービスを提供されて いるベンダーさんもちゃんと対 策されてるんですよ
#RPALT それならオンプレミスでやってみよう!! AIReadはオンプレミス
#RPALT AIReadの機能 文字認識(活字・手書き 対応言語:日本語・英語・中国語) データ抽出(定型・非定型) ※非定型帳票に対応 BtoBの先方書式のバックオフィス系帳票で有効
#RPALT でも、オンプレミスだったら文字学習とかどうするの? クラウドサービスは、学習データが蓄積され日々成長していきます。 でも、オンプレミスだと自分たちで文字の学習はやっていかないといけない。 当然の話ですね・・・・・・。
#RPALT 手書き文字はこんな感じで学習させます。 機械学習 閲覧・編集 AIRead Train Studio HW 教師データ (文字切取り画像)
読取り帳票画像データ 編集後データ 手書き モデル 教師データを追加学習
#RPALT 活字とかはこんな感じで 活字 モデル 頻出単語やフォントデータ を追加学習 AIRead Train Studio
#RPALT 認識率 学習を繰り返すことで精度を上げていきます。 もしかしたら認識率100%も夢じゃない!! ただし、私専用なら(笑)
#RPALT 専用のエディタを用いてデータ化したい位置や型を指定します。 帳票画像を 下地にして編集 出力項目を 一覧で表示 項目の詳細は ダイアログで 設定
マウス操作で 項目を指定 座標指定データ抽出機能(AIRead Form Editor:定型)
#RPALT データ自動抽出機能(非定型) ルール指定された箇所の文字を抽出しデータ化します。 AIReadが画像 を読み込み 罫線除去を行い 画像全体から文字 と座標情報を抽出 項目名
ルール claim_total “合計” の右下 claim_number “請求書No.” or “請求書番号” の右 item_quantity “数量” or “量” の下方向 item_unitprice “単価” の下方向 paydate “お支払期日” の右 AIRead ルール定義 ItemName Value Conf KeyWord claim_total 1573456 95合計 claim_subtot al 1657600 98小計 claim_numbe r : A123-03 98請求書No. claim_date 42936 98 bank_branch 東京中央支店 97支店名 bank_accttyp 当座 98口座種別 bank_acctnu m 9638527 98口座番号 : bank_paydat e 42967 93お支払期日 item_num 10845 98製品番号 item_name 応接テーブル 98製品名 item_quantity2 99数量 item_unitpric e 59800 98単価 item_amount 119600 98金額(税抜) item_num 22563 98製品番号 item_name 事務机 98製品名 item_quantity14 99数量 item_unitpric e 14800 96単価 item_amount 207200 98金額(税抜) ルール定義の 情報から値を 抽出 項目名、値、 信頼度、キー ワードを出力
#RPALT 閲覧・編集画面 開発機能 (AIRead Screen Designer) データ 編集が可能 AIRead 読取結果の画面
読み取った帳票を 画像として表示 項目ごとに 読取結果を表示 自動生成 Powered by ノンプログラミングでAIReadの 閲覧・編集Web画面を開発 リポジトリ
#RPALT AIRead ETL Option (OCR処理をバッチ形式で効率的に実装) そんな場合はAIRead ETL Optionを活用して柔軟なデータ連携! ページ跨ぎや可変フォームにもこれで対応。 Windows
Server AIRead ETL Option フォルダ監視起動 (ジョブやプロセス監視も可能) CSV/XML ファイル 指定時間起動 時間間隔起動 データチェック マスタ参照 他システムとの 柔軟なデータ連携 Powered by
#RPALT AIRead x RPA(WinActor) ※RPA Communityなのとウチ一次代理店なので AIRead とRPAツール(WinActor)が連携することで業務の効率化が実現 閲覧・編集
他システム、Excel、DB データ収集・投入の自動化 データ活用の自動化 画像データ
#RPALT AIReadは サーバ以外にも ・PCでも利用できます。(PC用のライセンスあります) ・クラウドサービスもあります!
#RPALT AIRead Stand-alone PCインストール型 AI x OCR ソリューション AI
x OCR「AIRead」をクライアントPCで小規模から利用ができます。(定型のみ) ※枚数無制限 活字・手書き文字、学習できます。 利用者 AIRead Stand-alone 定義 ファイル 学習 モデル
#RPALT AIRead on Cloud クラウド型 AI x OCR ソリューション
「AIRead on Cloud」とは、AI x OCR「AIRead」を小規模から従量課金型で利用ができるクラ ウド型のサービスです。 定型・非定型どちらも利用できます。 STEP : 4 ファイル出力 STEP : 1 アップロード STEP : 3 確認・修正 利用者 AIRead on Cloud STEP : 2 AI OCR実行 定義ファイル 学習モデル
#RPALT AIReadの利用イメージ 大~中規模 中~小規模 小規模 オンプレ (サーバ) オンプレ (サーバ) スタンドアロン
(PC) スタンドアロン (PC) クラウド 課金体系 オンプレ/クラウド・・・・枚数課金 ※オンプレは非定型帳票は枚数課金、定型帳票のみは無制限 スタンドアロン・・・・・・枚数無制限(但し、定型のみ) 高 価格 低
#RPALT AIREADコミュニティ(準備中) 何をやるのか? AIREADユーザへの技術情報提供 手書き学習モデルを定期的に提供 AIREADユーザ間での情報交換サイト開設 AI-OCRは導入したら終わりではありません。
育てていくものです。 コミュニティを通じて利用者の皆さんと一緒に AIReadを育てていきます。
#RPALT おまけ:こんな連携もできます。 DataSpider Technical Network (https://dstn.appresso.com/hc/ja)
#RPALT 事例とかプレスリリースとか https://www.ntt- at.co.jp/news/2019/detail/release190423.html https://news.mynavi.jp/kikaku/20180828- 681967/
#RPALT • アライズイノベーション株式会社(https://www.ariseinnovation.co.jp/) • 東京都中央区勝どき3-13-1 • TEL : 03-5534-9967 ※”AIRead”のロゴ及び商品名はアライズイノベーション株式会社の登録商標です(特許庁登録第6029981号)