Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
191025 利用シーンを考えてAI-OCR使ってみませんか アライズイノベーション 森康晴さん
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
RPACommunity
October 25, 2019
Technology
440
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
191025 利用シーンを考えてAI-OCR使ってみませんか アライズイノベーション 森康晴さん
RPACommunity
October 25, 2019
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
1.1k
201023 DX Suiteを触ってみた Ayy
rpabank
0
1.1k
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
670
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
670
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
730
201018 RPAの本質とトレンド Mitz
rpabank
0
550
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
510
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
490
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
450
Other Decks in Technology
See All in Technology
AIソロプレナー時代に2ヶ月で20人増員した事業創造会社の開発組織の話
miyatakoji
0
670
20260619 私の日常業務での生成 AI 活用
masaruogura
1
220
人材育成分科会.pdf
_awache
4
260
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
140
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
110
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
21
7k
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
データサイエンスを価値につなげるプロジェクト設計 〜 DS一年目が現場で得た気づき 〜
ysd113
1
260
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
220
2026TECHFRESH畢業分享會 - 葬送的通靈師:化系統與用戶雜訊成行動訊號
line_developers_tw
PRO
0
1.1k
2026TECHFRESH畢業分享會 - 原生還是跨平台? App 開發踩坑實錄
line_developers_tw
PRO
0
1.1k
日本 Fintech 未来予測レポート 2027〜2028年(オリジナル版)
8maki
0
2.2k
Featured
See All Featured
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
WCS-LA-2024
lcolladotor
0
630
Bash Introduction
62gerente
615
220k
Faster Mobile Websites
deanohume
310
31k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
Believing is Seeing
oripsolob
1
150
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
850
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Transcript
利用シーンを考えて AI-OCR使ってみませんか アライズイノベーション株式会社 森 康晴
自己紹介 • 森 康晴 • アライズイノベーション株式会社 • プリセールスやってますが一応技術者です。 • AI-OCR(まれにRPA)のお仕事やってます。
あず 蘭丸
AI-OCRで思われがちなこと • どんな帳票でもフォームとか自動で判断して読み取ってくれる! • 手書き文字も100%読み取ってくれる! • 入力作業が完全自動化!(RPAと連携で)
AI-OCRが苦手なこと ⚫ 一つの帳票内でレイアウトが異なる ⚫ ページを跨いでいる帳票 こんな感じ で時々変わ るやつとか ページまたいでるやつとか ちゃんとレイアウトは合わせてください。
AI-OCRはその辺りはあまりおりこうさんではないのです。
じゃぁ、AI-OCRのAIってなんなん? コレハ 「シ」 デス AI-OCR
AI-OCRのAIはこんなん!! コレハ 「ツ」 ナンヤデ♪ 「シ」 トチャウネンデ 文字の特徴やポイントなどを ディープラーニングによって把 握します。 これは
「ツ」 です AI-OCRのAI
AI-OCRのAIはこんなん!! 豊日自動車 タブン 「豊田自動車」 マチガッテルヤン シャーナイカラ ナオシトイタルワ こんな感じで予測変換など で間違って書かれたものを 修正してくれたりします。
コレハ 「ツ」 ヤデ ディープラーニング 後は文字を認識でき るようになります。 AI-OCR AI-OCR
そもそもAI-OCRの役割ってなんでしょうか? 手書き帳票・活字帳票をデータ化することより 入力作業を補完するものです。 入力作業を完全に取って代わってくれるわけではなかったりします。 なんでか? 読取率が100%じゃないんだもん。 ちょっとは間違えちゃうしね。
AI-OCR導入前 入力とチェックする人たち RPA
AI-OCR導入後 チェックする人たち RPA AI-OCRでデータ化
AI-OCRのサービスでは クラウドでのサービスが主になっています。 クラウドだとサーバを用意したりとかいろいろ手間なことから解放されますよね。 サーバのお守もしなくていいし、やめたくなったらいつでもやめられる。 でも、クラウドサービスでと言われるといろいろ課題があったりするケースも あったりしませんか?
クラウドサービスで言われがちなこと • 登録したデータのセキュリティは大丈夫か? • クラウド上に個人情報なんてあげられへんわ。 • 登録したデータはどう管理されてるのか明らかにしてほしい。 • そもそもクラウドにつなげないんですけど・・・。 •
データ化したいけど社外に書類を出すな!!と言われた。 とかとか、いうことも多いのではないでしょうか。 クラウドサービスを提供されているベンダーさんも ちゃんと対策されてるんですよ
それならオンプレミスでやってみよう!! AIReadはオンプレミス
AIREADの機能 • 文字認識(活字・手書き) • データ抽出(定型・非定型) ※非定型帳票に対応 BtoBの先方書式のバックオフィス系帳票で有効
でも、オンプレミスだったら文字学習とかどうするの? クラウドサービスは、学習データが蓄積され日々成長していきます。 でも、オンプレミスだと自分たちで文字の学習はやっていかないといけない。 当然の話ですね・・・・・・。
手書き文字はこんな感じで学習させます。 機械学習 閲覧・編集 AIRead Train Studio HW 教師データ (文字切取り画像) 読取り帳票画像データ
編集後データ 手書き モデル 教師データを追加学習
活字とかはこんな感じで 活字 モデル 頻出単語やフォントデータ を追加学習 AIRead Train Studio
認識率 • 学習を繰り返すことで精度を上げていきます。 • もしかしたら認識率100%も夢じゃない!! ただし、私専用なら(笑)
• 専用のエディタを用いてデータ化したい位置や型を指定します。 帳票画像を 下地にして編集 出力項目を 一覧で表示 項目の詳細は ダイアログで 設定 マウス操作で
項目を指定 座標指定データ抽出機能(AIRead Form Editor:定型)
データ自動抽出機能(非定型) • ルール指定された箇所の文字を抽出しデータ化します。 AIReadが画像 を読み込み 罫線除去を行い 画像全体から文字 と座標情報を抽出 項目名 ルール
claim_total “合計” の右下 claim_number “請求書No.” or “請求書番号” の右 item_quantity “数量” or “量” の下方向 item_unitprice “単価” の下方向 paydate “お支払期日” の右 AIRead ルール定義 ItemName Value Conf KeyWord claim_total 1573456 95合計 claim_subtot al 1657600 98小計 claim_numbe r : A123-03 98請求書No. claim_date 42936 98 bank_branch 東京中央支店 97支店名 bank_accttyp 当座 98口座種別 bank_acctnu m 9638527 98口座番号 : bank_paydat e 42967 93お支払期日 item_num 10845 98製品番号 item_name 応接テーブル 98製品名 item_quantity2 99数量 item_unitpric e 59800 98単価 item_amount 119600 98金額(税抜) item_num 22563 98製品番号 item_name 事務机 98製品名 item_quantity14 99数量 item_unitpric e 14800 96単価 item_amount 207200 98金額(税抜) ルール定義の 情報から値を 抽出 項目名、値、 信頼度、キー ワードを出力
閲覧・編集画面 開発機能 (AIREAD SCREEN DESIGNER) データ 編集が可能 AIRead 読取結果の画面 読み取った帳票を
画像として表示 項目ごとに 読取結果を表示 自動生成 Powered by ノンプログラミングでAIReadの 閲覧・編集Web画面を開発 リポジトリ
AIREAD ETL OPTION (OCR処理をバッチ形式で効率的に実装) そんな場合はAIRead ETL Optionを活用して柔軟なデータ連携! ページ跨ぎや可変フォームにもこれで対応。 Windows Server
AIRead ETL Option フォルダ監視起動 (ジョブやプロセス監視も可能) CSV/XML ファイル 指定時間起動 時間間隔起動 データチェック マスタ参照 他システムとの 柔軟なデータ連携 Powered by
AIREAD X RPA(WINACTOR) ※RPA COMMUNITYなのとウチ一次代理店なので • AIRead とRPAツール(WinActor)が連携することで業務の効率化が実現 閲覧・編集 他システム、Excel、DB
データ収集・投入の自動化 データ活用の自動化 画像データ
でも、利用シーンって? オンプレミス(サーバ型)の話しかしてへんやん って思ってる方
AIREADは サーバ以外にも ・PCでも利用できます。(PC用のライセンスあります) ・クラウドサービス(Coming Soon ちょっと待ってね)
AIREAD STAND-ALONE 利用者 AIRead Stand-alone 定義 ファイル 学習 モデル •
PCインストール型 AI x OCR ソリューション AI x OCR「AIRead」をクライアントPCで小規模から利用ができます。(定型のみ) 活字・手書き文字、学習できます。 2019年10月4日リリース
AIREAD ON CLOUD Coming Soon STEP : 4 ファイル出力 STEP
: 1 アップロード STEP : 3 確認・修正 利用者 AIRead on Cloud STEP : 2 AI OCR実行 定義ファイル 学習モデル • クラウド型 AI x OCR ソリューション 「AIRead on Cloud」とは、AI x OCR「AIRead」を小規模から従量課金型で利用ができる クラウド型のサービスです。 定型・非定型どちらも利用できます。
AIREADの利用イメージ 大~中規模 中~小規模 小規模 オンプレ (サーバ) オンプレ (サーバ) スタンドアロン (PC)
スタンドアロン (PC) クラウド 課金体系 オンプレ/クラウド・・・・枚数課金 スタンドアロン・・・・・・枚数無制限(但し、定型のみ) 高 価格 低
AIREADコミュニティ(2019年秋から活動開始予定) 何をやるのか? • AIREADユーザへの技術情報提供 • 手書き学習モデルを定期的に提供 • AIREADユーザ間での情報交換サイト開設 AI-OCRは導入したら終わりではありません。 育てていくものです。
コミュニティを通じて利用者の皆さんと一緒に AIReadを育てていきます。
おまけ:こんな連携もできます。 DATASPIDER TECHNICAL NETWORK (HTTPS://DSTN.APPRESSO.COM/HC/JA)
事例とかプレスリリースとか https://www.ntt-at.co.jp/news/2019/detail/release190423.html https://news.mynavi.jp/kikaku/20180828-681967/
• アライズイノベーション株式会社(https://www.ariseinnovation.co.jp/) • 東京都中央区勝どき3-13-1 • TEL : 03-5534-9967 ※”AIRead”のロゴ及び商品名はアライズイノベーション株式会社の登録商標です(特許庁登録第6029981号)