Upgrade to Pro — share decks privately, control downloads, hide ads and more …

200204 AIReadって知ってます? アライズイノベーション株式会社 森さん

RPABANK
February 04, 2020

200204 AIReadって知ってます? アライズイノベーション株式会社 森さん

200204 AIReadって知ってます? アライズイノベーション株式会社 森さん

RPABANK

February 04, 2020
Tweet

More Decks by RPABANK

Other Decks in Technology

Transcript

  1. #RPALT
    AIReadって知ってます?
    アライズイノベーション株式会社
    森 康晴

    View Slide

  2. #RPALT
    自己紹介
     森 康晴
     アライズイノベーション株式会社
     プリセールスやってますが一応技術者です。
     AI-OCR(まれにRPA)のお仕事やってます。
    あず
    蘭丸
    つながってやっても
    いいよという方はぜひ

    View Slide

  3. #RPALT
    AI-OCRで思われがちなこと
     どんな帳票でもフォームとか自動で判断して読み取ってくれる!
     手書き文字も100%読み取ってくれる!
     入力作業が完全自動化!(RPAと連携で)
    まだそこまでたどりつけてない・・・・
    ごめん、これも無理
    100%はなかなか、なぁ・・・・・

    View Slide

  4. #RPALT
    AI-OCRが苦手なこと
    ⚫ 一つの帳票内でレイアウトが異なる
    ⚫ ページを跨いでいる帳票
    こんな感じ
    で時々変わ
    るやつとか
    ページまたいでるやつとか
    ちゃんとレイアウトは合わせてください。
    AI-OCRはその辺りはあまりおりこうさんではないのです。

    View Slide

  5. #RPALT
    じゃぁ、AI-OCRのAIってなんなん?
    コレハ
    「シ」
    デス
    AI-OCR

    View Slide

  6. #RPALT
    AI-OCRのAIはこんなん!!
    コレハ
    「ツ」
    ナンヤデ♪
    「シ」
    トチャウネンデ
    文字の特徴やポイントなどを
    ディープラーニングによって把
    握します。
    これは
    「ツ」
    です
    AI-OCRのAI

    View Slide

  7. #RPALT
    AI-OCRのAIはこんなん!!
    豊日自動車
    タブン
    「豊田自動車」ヤロ
    マチガッテルヤン
    シャーナイカラ
    ナオシトイタルワ
    こんな感じで予測変換など
    で間違って書かれたものを
    修正してくれたりします。
    コレハ
    「ツ」
    ヤデ
    ディープラーニング
    後は文字を認識でき
    るようになります。
    AI-OCR
    AI-OCR

    View Slide

  8. #RPALT
    そもそもAI-OCRの役割ってなんでしょうか?
    手書き帳票・活字帳票をデータ化することより
    入力作業を補完するものです。
    入力作業を完全に取って代わってくれるわけではなかったりします。
    なんでか?
    読取率が100%じゃないんだもん。
    ちょっとは間違えちゃうしね。

    View Slide

  9. #RPALT
    AI-OCR導入前
    入力とチェックする人たち
    RPA

    View Slide

  10. #RPALT
    AI-OCR導入後
    チェックする人たち
    RPA
    AI-OCRでデータ化

    View Slide

  11. #RPALT
    AI-OCRのサービスでは
    クラウドでのサービスが主になっています。
    クラウドだとサーバを用意したりとかいろいろ手間なことから解放されますよね。
    サーバのお守もしなくていいし、やめたくなったらいつでもやめられる。
    でも、クラウドサービスでと言われるといろいろ課題があったりするケースも
    あったりしませんか?

    View Slide

  12. #RPALT
    クラウドサービスで言われがちなこと
     登録したデータのセキュリティは大丈夫か?
     クラウド上に個人情報なんてあげられへんわ。
     登録したデータはどう管理されてるのか明らかにしてほしい。
     そもそもクラウドにつなげないんですけど・・・。
     データ化したいけど社外に書類を出すな!!と言われた。
    とかとか、いうことも多いのではないでしょうか。
    クラウドサービスを提供されて
    いるベンダーさんもちゃんと対
    策されてるんですよ

    View Slide

  13. #RPALT
    それならオンプレミスでやってみよう!!
    AIReadはオンプレミス

    View Slide

  14. #RPALT
    AIReadの機能
     文字認識(活字・手書き 対応言語:日本語・英語・中国語)
     データ抽出(定型・非定型)
    ※非定型帳票に対応 BtoBの先方書式のバックオフィス系帳票で有効

    View Slide

  15. #RPALT
    でも、オンプレミスだったら文字学習とかどうするの?
    クラウドサービスは、学習データが蓄積され日々成長していきます。
    でも、オンプレミスだと自分たちで文字の学習はやっていかないといけない。
    当然の話ですね・・・・・・。

    View Slide

  16. #RPALT
    手書き文字はこんな感じで学習させます。
    機械学習
    閲覧・編集
    AIRead Train Studio HW
    教師データ
    (文字切取り画像)
    読取り帳票画像データ 編集後データ
    手書き
    モデル 教師データを追加学習

    View Slide

  17. #RPALT
    活字とかはこんな感じで
    活字
    モデル
    頻出単語やフォントデータ
    を追加学習
    AIRead Train Studio

    View Slide

  18. #RPALT
    認識率
     学習を繰り返すことで精度を上げていきます。
     もしかしたら認識率100%も夢じゃない!! ただし、私専用なら(笑)

    View Slide

  19. #RPALT
     専用のエディタを用いてデータ化したい位置や型を指定します。
    帳票画像を
    下地にして編集
    出力項目を
    一覧で表示
    項目の詳細は
    ダイアログで
    設定
    マウス操作で
    項目を指定
    座標指定データ抽出機能(AIRead Form Editor:定型)

    View Slide

  20. #RPALT
    データ自動抽出機能(非定型)
     ルール指定された箇所の文字を抽出しデータ化します。
    AIReadが画像
    を読み込み
    罫線除去を行い
    画像全体から文字
    と座標情報を抽出
    項目名 ルール
    claim_total “合計” の右下
    claim_number
    “請求書No.” or
    “請求書番号” の右
    item_quantity
    “数量” or “量”
    の下方向
    item_unitprice “単価” の下方向
    paydate “お支払期日” の右
    AIRead ルール定義
    ItemName Value Conf KeyWord
    claim_total 1573456 95合計
    claim_subtot
    al
    1657600 98小計
    claim_numbe
    r
    : A123-03 98請求書No.
    claim_date 42936 98
    bank_branch 東京中央支店 97支店名
    bank_accttyp 当座 98口座種別
    bank_acctnu
    m
    9638527 98口座番号 :
    bank_paydat
    e
    42967 93お支払期日
    item_num 10845 98製品番号
    item_name 応接テーブル 98製品名
    item_quantity2 99数量
    item_unitpric
    e
    59800 98単価
    item_amount 119600 98金額(税抜)
    item_num 22563 98製品番号
    item_name 事務机 98製品名
    item_quantity14 99数量
    item_unitpric
    e
    14800 96単価
    item_amount 207200 98金額(税抜)
    ルール定義の
    情報から値を
    抽出
    項目名、値、
    信頼度、キー
    ワードを出力

    View Slide

  21. #RPALT
    閲覧・編集画面 開発機能
    (AIRead Screen Designer)
    データ
    編集が可能
    AIRead 読取結果の画面
    読み取った帳票を
    画像として表示
    項目ごとに
    読取結果を表示
    自動生成
    Powered by
    ノンプログラミングでAIReadの
    閲覧・編集Web画面を開発
    リポジトリ

    View Slide

  22. #RPALT
    AIRead ETL Option
    (OCR処理をバッチ形式で効率的に実装)
    そんな場合はAIRead ETL Optionを活用して柔軟なデータ連携!
    ページ跨ぎや可変フォームにもこれで対応。
    Windows Server
    AIRead ETL Option
    フォルダ監視起動
    (ジョブやプロセス監視も可能)
    CSV/XML
    ファイル
    指定時間起動
    時間間隔起動
    データチェック
    マスタ参照
    他システムとの
    柔軟なデータ連携
    Powered by

    View Slide

  23. #RPALT
    AIRead x RPA(WinActor)
    ※RPA Communityなのとウチ一次代理店なので
     AIRead とRPAツール(WinActor)が連携することで業務の効率化が実現
    閲覧・編集
    他システム、Excel、DB
    データ収集・投入の自動化
    データ活用の自動化
    画像データ

    View Slide

  24. #RPALT
    AIReadは
    サーバ以外にも
    ・PCでも利用できます。(PC用のライセンスあります)
    ・クラウドサービスもあります!

    View Slide

  25. #RPALT
    AIRead Stand-alone
     PCインストール型 AI x OCR ソリューション
    AI x OCR「AIRead」をクライアントPCで小規模から利用ができます。(定型のみ)
    ※枚数無制限
    活字・手書き文字、学習できます。
    利用者
    AIRead Stand-alone
    定義
    ファイル
    学習
    モデル

    View Slide

  26. #RPALT
    AIRead on Cloud
     クラウド型 AI x OCR ソリューション
    「AIRead on Cloud」とは、AI x OCR「AIRead」を小規模から従量課金型で利用ができるクラ
    ウド型のサービスです。
    定型・非定型どちらも利用できます。
    STEP : 4 ファイル出力
    STEP : 1 アップロード
    STEP : 3 確認・修正
    利用者
    AIRead on Cloud
    STEP : 2 AI OCR実行
    定義ファイル
    学習モデル

    View Slide

  27. #RPALT
    AIReadの利用イメージ
    大~中規模 中~小規模 小規模
    オンプレ
    (サーバ)
    オンプレ
    (サーバ)
    スタンドアロン
    (PC)
    スタンドアロン
    (PC)
    クラウド
    課金体系
    オンプレ/クラウド・・・・枚数課金
    ※オンプレは非定型帳票は枚数課金、定型帳票のみは無制限
    スタンドアロン・・・・・・枚数無制限(但し、定型のみ)
    高 価格 低

    View Slide

  28. #RPALT
    AIREADコミュニティ(準備中)
    何をやるのか?
     AIREADユーザへの技術情報提供
     手書き学習モデルを定期的に提供
     AIREADユーザ間での情報交換サイト開設
    AI-OCRは導入したら終わりではありません。
    育てていくものです。
    コミュニティを通じて利用者の皆さんと一緒に
    AIReadを育てていきます。

    View Slide

  29. #RPALT
    おまけ:こんな連携もできます。
    DataSpider Technical Network
    (https://dstn.appresso.com/hc/ja)

    View Slide

  30. #RPALT
    事例とかプレスリリースとか
    https://www.ntt-
    at.co.jp/news/2019/detail/release190423.html
    https://news.mynavi.jp/kikaku/20180828-
    681967/

    View Slide

  31. #RPALT
    • アライズイノベーション株式会社(https://www.ariseinnovation.co.jp/)
    • 東京都中央区勝どき3-13-1
    • TEL : 03-5534-9967
    ※”AIRead”のロゴ及び商品名はアライズイノベーション株式会社の登録商標です(特許庁登録第6029981号)

    View Slide