Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
190806 AI-OCRってくらうどだけなん? アライズイノベーション 森さん
Search
RPACommunity
August 06, 2019
Technology
410
0
Share
190806 AI-OCRってくらうどだけなん? アライズイノベーション 森さん
190806 AI-OCRってくらうどだけなん? アライズイノベーション 森さん
RPACommunity
August 06, 2019
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
1.1k
201023 DX Suiteを触ってみた Ayy
rpabank
0
1.1k
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
660
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
660
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
720
201018 RPAの本質とトレンド Mitz
rpabank
0
550
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
500
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
480
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
440
Other Decks in Technology
See All in Technology
20260513_生成AIを専属DSに_AI分析結果の検品テクニック_ハンズオン_交通事故データ
doradora09
PRO
0
230
AIエージェントの支払い基盤 AgentCore Payments概要
kmiya84377
2
200
AWS運用におけるAI Agent活用術 / JAWS-UG 神戸 #11 LT大会
genda
1
270
全社統制を維持しながら現場負担をどう減らすか〜プラットフォームチームとセキュリティチームで進めたSecurity Hub活用によるAWS統制の見直し〜/secjaws-security-hub-custom-insights
mhrtech
1
540
会社説明資料|株式会社ギークプラス ソフトウェア事業部
geekplus_tech
0
290
Fラン学生が考える、AI時代のデザインに執着した突破口
husengs7
1
150
「背中を見て育て」からの卒業 〜専門技術としてのテスト設計を軸に、品質保証のバトンを繋ぐ〜 #genda_tech_talk
nihonbuson
PRO
3
1.4k
Claude Codeウェビナー資料 - AWSの最新機能をClaude Codeで高速に検証する
oshanqq
0
860
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
15
100k
AI飲み会幹事エージェントを作っただけなのに
ykimi
0
230
エムスリーテクノロジーズ株式会社 エンジニア向け紹介資料 / M3 Technologies Company Deck
m3_engineering
0
160
CARTA HOLDINGS エンジニア向け 採用ピッチ資料 / CARTA-GUIDE-for-Engineers
carta_engineering
0
47k
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
140
So, you think you're a good person
axbom
PRO
2
2k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
210
Joys of Absence: A Defence of Solitary Play
codingconduct
1
360
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Claude Code のすすめ
schroneko
67
220k
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
550
Technical Leadership for Architectural Decision Making
baasie
3
360
Designing for Performance
lara
611
70k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
54k
Producing Creativity
orderedlist
PRO
348
40k
Transcript
AI-OCRはクラウドだけなん? アライズイノベーション株式会社 森 康晴
自己紹介 • 森 康晴 • アライズイノベーション株式会社 • プリセールスやってます。 • AI-OCRとかRPAのお仕事やってます。
クラウドサービスのAI-OCRで言われがちなこと • 登録したデータのセキュリティが気になるな~ • クラウド上に個人情報なんてあげたら会社にしばかれるわ。 • 登録したデータはどうなってるの? クラウドって言うだけでいろいろ言われちゃ事も ありそうですよね。 使ってみたいけど使えない書類が多いんです~な話もありそう。
だったら? オンプレミスでAI-OCRってないの? あります!(うちの製品)
でも、オンプレミスだったら文字学習とかどうするの? クラウドのように、どんどこ学習データが入ってくるわけではない。 自分たちで文字の学習はやっていかないといけない。 じゃぁ、どうやって学習させればええのん?
こんな感じで学習させます。 手書き文字を学習させる場合 • 修正した文字を学習させフィード バックし、精度をあげていく 閲覧・編集 機械学習 フィードバック 教師データ 正解データ
画像データ 編集後データ
活字とかはこんな感じで • 学習させたい活字モデル(どんなフォント使うとか)用意 • 学習後のデータをフィードバック 機械学習 教師データ 頻出単語 AIモデルの高度化
認識率 • 学習を繰り返すことで精度を上げていきます。 • もしかしたら認識率100%も夢じゃないかも…( = =) トオイメ目
• 専用のエディタを用いてデータ化したい位置や型を指定します。 帳票画像を 下地にして編集 出力項目を 一覧で表示 項目の詳細は ダイアログで 設定 マウス操作で
項目を指定 座標指定データ抽出機能(AIRead Form Editor:定型)
データ自動抽出機能(非定型) • ルール指定された箇所の文字を抽出しデータ化します。 AIReadが画像 を読み込み 罫線除去を行い 画像全体から文字 と座標情報を抽出 項目名 ルール
claim_total “合計” の右下 claim_number “請求書No.” or “請求書番号” の右 item_quantity “数量” or “量” の下方向 item_unitprice “単価” の下方向 paydate “お支払期日” の右 AIRead ルール定義 ItemName Value Conf KeyWord claim_total 1573456 95合計 claim_subtot al 1657600 98小計 claim_numbe r : A123-03 98請求書No. claim_date 42936 98 bank_branch 東京中央支店 97支店名 bank_accttyp 当座 98口座種別 bank_acctnu m 9638527 98口座番号 : bank_paydat e 42967 93お支払期日 item_num 10845 98製品番号 item_name 応接テーブル 98製品名 item_quantity2 99数量 item_unitpric e 59800 98単価 item_amount 119600 98金額(税抜) item_num 22563 98製品番号 item_name 事務机 98製品名 item_quantity14 99数量 item_unitpric e 14800 96単価 item_amount 207200 98金額(税抜) ルール定義の 情報から値を 抽出 項目名、値、 信頼度、キー ワードを出力
閲覧・編集画面 開発機能 (AIREAD SCREEN DESIGNER) データ 編集が可能 AIRead 読取結果の画面 読み取った帳票を
画像として表示 項目ごとに 読取結果を表示 自動生成 Powered by ノンプログラミングでAIReadの 閲覧・編集Web画面を開発 リポジトリ
AIREAD ETL OPTION AIReadをバッチ形式で効率的に実装するしたい。 そんな場合はAIRead ETL Optionを活用して柔軟なデータ連携 Windows Server AIRead
ETL Option フォルダ監視起動 (ジョブやプロセス監視も可能) CSV/XML ファイル 指定時間起動 時間間隔起動 データチェック マスタ参照 他システムとの 柔軟なデータ連携 Powered by
こんな連携もできます。 DATASPIDER TECHNICAL NETWORK
事例とかプレスリリースとか https://www.ntt-at.co.jp/news/2019/detail/release190423.html https://news.mynavi.jp/kikaku/20180828-681967/
他にも機能はいろいろあります。 • 気になる方、ぜひ懇親会でお話ししましょう! • アライズイノベーション株式会社(https://www.ariseinnovation.co.jp/) • 東京都中央区勝どき3-13-1 • mail:
[email protected]
•
TEL : 03-5534-9967 ※”AIRead”のロゴ及び商品名はアライズイノベーション株式会社の登録商標です(特許庁登録第6029981号)