Slide 1

Slide 1 text

利用シーンを考えて AI-OCR使ってみませんか アライズイノベーション株式会社 森 康晴

Slide 2

Slide 2 text

自己紹介 • 森 康晴 • アライズイノベーション株式会社 • プリセールスやってますが一応技術者です。 • AI-OCR(まれにRPA)のお仕事やってます。 あず 蘭丸

Slide 3

Slide 3 text

AI-OCRで思われがちなこと • どんな帳票でもフォームとか自動で判断して読み取ってくれる! • 手書き文字も100%読み取ってくれる! • 入力作業が完全自動化!(RPAと連携で)

Slide 4

Slide 4 text

AI-OCRが苦手なこと ⚫ 一つの帳票内でレイアウトが異なる ⚫ ページを跨いでいる帳票 こんな感じ で時々変わ るやつとか ページまたいでるやつとか ちゃんとレイアウトは合わせてください。 AI-OCRはその辺りはあまりおりこうさんではないのです。

Slide 5

Slide 5 text

じゃぁ、AI-OCRのAIってなんなん? コレハ 「シ」 デス AI-OCR

Slide 6

Slide 6 text

AI-OCRのAIはこんなん!! コレハ 「ツ」 ナンヤデ♪ 「シ」 トチャウネンデ 文字の特徴やポイントなどを ディープラーニングによって把 握します。 これは 「ツ」 です AI-OCRのAI

Slide 7

Slide 7 text

AI-OCRのAIはこんなん!! 豊日自動車 タブン 「豊田自動車」 マチガッテルヤン シャーナイカラ ナオシトイタルワ こんな感じで予測変換など で間違って書かれたものを 修正してくれたりします。 コレハ 「ツ」 ヤデ ディープラーニング 後は文字を認識でき るようになります。 AI-OCR AI-OCR

Slide 8

Slide 8 text

そもそもAI-OCRの役割ってなんでしょうか? 手書き帳票・活字帳票をデータ化することより 入力作業を補完するものです。 入力作業を完全に取って代わってくれるわけではなかったりします。 なんでか? 読取率が100%じゃないんだもん。 ちょっとは間違えちゃうしね。

Slide 9

Slide 9 text

AI-OCR導入前 入力とチェックする人たち RPA

Slide 10

Slide 10 text

AI-OCR導入後 チェックする人たち RPA AI-OCRでデータ化

Slide 11

Slide 11 text

AI-OCRのサービスでは クラウドでのサービスが主になっています。 クラウドだとサーバを用意したりとかいろいろ手間なことから解放されますよね。 サーバのお守もしなくていいし、やめたくなったらいつでもやめられる。 でも、クラウドサービスでと言われるといろいろ課題があったりするケースも あったりしませんか?

Slide 12

Slide 12 text

クラウドサービスで言われがちなこと • 登録したデータのセキュリティは大丈夫か? • クラウド上に個人情報なんてあげられへんわ。 • 登録したデータはどう管理されてるのか明らかにしてほしい。 • そもそもクラウドにつなげないんですけど・・・。 • データ化したいけど社外に書類を出すな!!と言われた。 とかとか、いうことも多いのではないでしょうか。 クラウドサービスを提供されているベンダーさんも ちゃんと対策されてるんですよ

Slide 13

Slide 13 text

それならオンプレミスでやってみよう!! AIReadはオンプレミス

Slide 14

Slide 14 text

AIREADの機能 • 文字認識(活字・手書き) • データ抽出(定型・非定型) ※非定型帳票に対応 BtoBの先方書式のバックオフィス系帳票で有効

Slide 15

Slide 15 text

でも、オンプレミスだったら文字学習とかどうするの? クラウドサービスは、学習データが蓄積され日々成長していきます。 でも、オンプレミスだと自分たちで文字の学習はやっていかないといけない。 当然の話ですね・・・・・・。

Slide 16

Slide 16 text

手書き文字はこんな感じで学習させます。 機械学習 閲覧・編集 AIRead Train Studio HW 教師データ (文字切取り画像) 読取り帳票画像データ 編集後データ 手書き モデル 教師データを追加学習

Slide 17

Slide 17 text

活字とかはこんな感じで 活字 モデル 頻出単語やフォントデータ を追加学習 AIRead Train Studio

Slide 18

Slide 18 text

認識率 • 学習を繰り返すことで精度を上げていきます。 • もしかしたら認識率100%も夢じゃない!! ただし、私専用なら(笑)

Slide 19

Slide 19 text

• 専用のエディタを用いてデータ化したい位置や型を指定します。 帳票画像を 下地にして編集 出力項目を 一覧で表示 項目の詳細は ダイアログで 設定 マウス操作で 項目を指定 座標指定データ抽出機能(AIRead Form Editor:定型)

Slide 20

Slide 20 text

データ自動抽出機能(非定型) • ルール指定された箇所の文字を抽出しデータ化します。 AIReadが画像 を読み込み 罫線除去を行い 画像全体から文字 と座標情報を抽出 項目名 ルール claim_total “合計” の右下 claim_number “請求書No.” or “請求書番号” の右 item_quantity “数量” or “量” の下方向 item_unitprice “単価” の下方向 paydate “お支払期日” の右 AIRead ルール定義 ItemName Value Conf KeyWord claim_total 1573456 95合計 claim_subtot al 1657600 98小計 claim_numbe r : A123-03 98請求書No. claim_date 42936 98 bank_branch 東京中央支店 97支店名 bank_accttyp 当座 98口座種別 bank_acctnu m 9638527 98口座番号 : bank_paydat e 42967 93お支払期日 item_num 10845 98製品番号 item_name 応接テーブル 98製品名 item_quantity2 99数量 item_unitpric e 59800 98単価 item_amount 119600 98金額(税抜) item_num 22563 98製品番号 item_name 事務机 98製品名 item_quantity14 99数量 item_unitpric e 14800 96単価 item_amount 207200 98金額(税抜) ルール定義の 情報から値を 抽出 項目名、値、 信頼度、キー ワードを出力

Slide 21

Slide 21 text

閲覧・編集画面 開発機能 (AIREAD SCREEN DESIGNER) データ 編集が可能 AIRead 読取結果の画面 読み取った帳票を 画像として表示 項目ごとに 読取結果を表示 自動生成 Powered by ノンプログラミングでAIReadの 閲覧・編集Web画面を開発 リポジトリ

Slide 22

Slide 22 text

AIREAD ETL OPTION (OCR処理をバッチ形式で効率的に実装) そんな場合はAIRead ETL Optionを活用して柔軟なデータ連携! ページ跨ぎや可変フォームにもこれで対応。 Windows Server AIRead ETL Option フォルダ監視起動 (ジョブやプロセス監視も可能) CSV/XML ファイル 指定時間起動 時間間隔起動 データチェック マスタ参照 他システムとの 柔軟なデータ連携 Powered by

Slide 23

Slide 23 text

AIREAD X RPA(WINACTOR) ※RPA COMMUNITYなのとウチ一次代理店なので • AIRead とRPAツール(WinActor)が連携することで業務の効率化が実現 閲覧・編集 他システム、Excel、DB データ収集・投入の自動化 データ活用の自動化 画像データ

Slide 24

Slide 24 text

でも、利用シーンって? オンプレミス(サーバ型)の話しかしてへんやん って思ってる方

Slide 25

Slide 25 text

AIREADは サーバ以外にも ・PCでも利用できます。(PC用のライセンスあります) ・クラウドサービス(Coming Soon ちょっと待ってね)

Slide 26

Slide 26 text

AIREAD STAND-ALONE 利用者 AIRead Stand-alone 定義 ファイル 学習 モデル • PCインストール型 AI x OCR ソリューション AI x OCR「AIRead」をクライアントPCで小規模から利用ができます。(定型のみ) 活字・手書き文字、学習できます。 2019年10月4日リリース

Slide 27

Slide 27 text

AIREAD ON CLOUD Coming Soon STEP : 4 ファイル出力 STEP : 1 アップロード STEP : 3 確認・修正 利用者 AIRead on Cloud STEP : 2 AI OCR実行 定義ファイル 学習モデル • クラウド型 AI x OCR ソリューション 「AIRead on Cloud」とは、AI x OCR「AIRead」を小規模から従量課金型で利用ができる クラウド型のサービスです。 定型・非定型どちらも利用できます。

Slide 28

Slide 28 text

AIREADの利用イメージ 大~中規模 中~小規模 小規模 オンプレ (サーバ) オンプレ (サーバ) スタンドアロン (PC) スタンドアロン (PC) クラウド 課金体系 オンプレ/クラウド・・・・枚数課金 スタンドアロン・・・・・・枚数無制限(但し、定型のみ) 高 価格 低

Slide 29

Slide 29 text

AIREADコミュニティ(2019年秋から活動開始予定) 何をやるのか? • AIREADユーザへの技術情報提供 • 手書き学習モデルを定期的に提供 • AIREADユーザ間での情報交換サイト開設 AI-OCRは導入したら終わりではありません。 育てていくものです。 コミュニティを通じて利用者の皆さんと一緒に AIReadを育てていきます。

Slide 30

Slide 30 text

おまけ:こんな連携もできます。 DATASPIDER TECHNICAL NETWORK (HTTPS://DSTN.APPRESSO.COM/HC/JA)

Slide 31

Slide 31 text

事例とかプレスリリースとか https://www.ntt-at.co.jp/news/2019/detail/release190423.html https://news.mynavi.jp/kikaku/20180828-681967/

Slide 32

Slide 32 text

• アライズイノベーション株式会社(https://www.ariseinnovation.co.jp/) • 東京都中央区勝どき3-13-1 • TEL : 03-5534-9967 ※”AIRead”のロゴ及び商品名はアライズイノベーション株式会社の登録商標です(特許庁登録第6029981号)