Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI-OCRはどうやって精度を計測しているか
Search
hikiaki
October 29, 2019
Business
1.5k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AI-OCRはどうやって精度を計測しているか
hikiaki
October 29, 2019
More Decks by hikiaki
See All by hikiaki
DIGITAL WORLD ONLINE 2021 WINTER 4日前祭 コロナ撲滅DX
hikiaki
0
510
LINEで叶える、ニューノーマルな経理のカタチ
hikiaki
0
210
Introduction of LINE API at 20200930 freee×IBM×LINE勉強会
hikiaki
0
680
面倒な申請処理もLINEで自動化!eKYCforLINEBRAIN
hikiaki
0
530
Panas○nicの女子家電をドローンで飛ばしたい
hikiaki
0
690
AI-OCRはどうやって文字を読み取るのか.pdf
hikiaki
0
690
AI-OCRはどうやって文字を読み取るのか
hikiaki
0
600
AI-OCRベンダーがもの申す!AI-OCRの役割を理解していますか?
hikiaki
0
1.3k
AI-OCRとRPAの関係性
hikiaki
0
730
Other Decks in Business
See All in Business
データ民主化の推進に必要なメンタリティーを伝えたい
hikaruri
0
140
ネクストビートコーポレートガイド/corporate-guide
nextbeat
3
86k
株式会社アシスト_会社紹介資料
ashisuto_career
3
180k
FIGEO採用ピッチ資料
figeohr
0
350
楽しかった仕事の理由を深掘りしてみた
suzakiyoshito
0
150
ログラス会社紹介資料 / Loglass Company Deck
loglass2019
17
550k
自分のハンドルを握る〜AI時代だからこそ求められるセルフマネジメントの技術/Self-Management Skills Needed More Than Ever in the AI Era
ikuodanaka
1
420
株式会社リバイブル 会社説明資料
rebible
0
1k
営業、広報、開発。 多面的なAIネイティブ化のための 基盤について
timakin
0
210
パーソルクロステクノロジー_DXソリューション本部のご紹介 / Introduction_of_dx
pxt_gs_ssol
0
2.1k
HP掲載プラン
desaki
0
220
株式会社Beer and Tech/HitoHana(ひとはな) 採用資料 2026.06 .09
beerandtech_recruiter
1
48k
Featured
See All Featured
How to Ace a Technical Interview
jacobian
281
24k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
The Language of Interfaces
destraynor
162
27k
Six Lessons from altMBA
skipperchong
29
4.3k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.3k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.5k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
400
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.7k
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
190
Believing is Seeing
oripsolob
1
140
Music & Morning Musume
bryan
47
7.2k
Have SEOs Ruined the Internet? - User Awareness of SEO in 2025
akashhashmi
0
370
Transcript
AI-OCR は × 2019/10/29 RPA勉強&LT会! RPALT⼥⼦部 vol.4 株式会社アジラ 引間 明⼦
Akiko Hikima どうやって精度を計測しているか
#RPALT Introduction ⽣命保険会社の汎⽤機(COBOL)開発、 @cosmeサロン(当時ispot)のweb・app開発、 クラウド (Salesforce)開発、LeapMindを経て、 2019/06からAsillaにJoin。 Asillaではアプリケーション事業部にて、 「やさしい」AI-OCR JijillaのPMをやってます。
実は、AgritechがやりたくてAsillaにJoinしまし た。Drone⾶ばしたい! 引間 明⼦ Akiko Hikima Presented by @aki8h3
#RPALT Whatʼs asilla? 画像認識技術を中⼼とした ソリューションを開発・提供する AIスタートアップ企業。 【第⼀回⼈⼯知能EXPO】株式会社アジラの⾏動認識技術デモ 2017年6⽉ 第⼀回⼈⼯知能EXPOに 「⾏動認識技術」を出展
2018年10⽉ ⼿書き⽂字OCRを 「AIビジネス展2018」 にて発表 2019年度、 経産省の【J-Startup】 に選定していただきました。 特許番号 6525181 ⾏動推定装置 特許番号 6525180 対象数特定装置 特許番号 6525179 ⾏動推定装置(背景) ⼿書き・活字に対応の AI-OCR【ジジラ】SaaS版を 2019年7⽉リリース。 ⾏動認識技術に関する特許を取得し、 画像認識技術に関する特許も出願準備中 Presented by 各種⼿書き帳票・活字帳票を読み取り、 テキスト化する⽂字認識ソリューション
#RPALT Presented by アジラは アジアのゴジラに なりたい!
#RPALT Presented by アジラが開発した ⽂字認識サービス 字々ラ!?ジジラ!!
#RPALT Presented by 体感として、 公開している精度(この場合は90%とします)を 感じない 導⼊後に出るAI-OCRへの不満 お悩み
#RPALT Presented by そもそも精度ってどうやって計測するの?? 導⼊後に出るAI-OCRへの不満 お悩み
#RPALT Presented by 1. CER(Character Error Rate) 精度はどうやって計測するの? ⽂字を1⽂字ずつ⽐較して計算する 2.
WER(Words Error Rate) 単語の単位で⽐較して計算する CERとWER、2つの主流な計測⼿法があります
#RPALT Presented by CER=wrong character/total character (不正解⽂字数/合計⽂字数) 合計⽂字数に対する、不正解⽂字数の割合で 算出します (認識)精度=1-CER
精度はどうやって計測するの? CER(Character Error Rate)=⽂字誤り率
#RPALT Presented by 精度はどうやって計測するの? を ”いんご” と認識した場合 (認識)精度=1-(1/3) ※ 1-(不正解⽂字数/合計⽂字数)
の認識精度は、66.67% 例)
#RPALT Presented by 1. りんご ・・・ 1-(3/3) = 100% 2.
りんこ ・・・ 1-(1/3) = 66.67% 3. りん ・・・ 1-(1/3) = 66.67% 4. レノんご ・・・ 1-(2/4) = 50% 5. いりんご ・・・ 1-(1/4) = 75% 精度はどうやって計測するの? 例) 認識結果 精度
#RPALT Presented by 精度はどうやって計測するの? サービス全体の精度=n⼈×n種類の帳票の 1-CER n⼈が⼿書き n種類の帳票の ⽂字数 1-(不正解⽂字数
-合計⽂字数)
#RPALT Presented by 精度はどうやって計測するの? 精度とは、あくまで精度計測⽤の帳票で計測した数値であるため、 ⾃社で同等の数値が出るとは限らない 精度計測⽤の帳票 ⾃社の帳票 数字多め? 表あり?
⽂字⼩さめ? 全⾓⽂字多め? 表なし ⽂字⼤きめ? 条件も全然違う
#RPALT Presented by 10件中9件が正解 10件全ての⽂字が9割の確率で認識出来る 精度はどうやって計測するの? 1枚の帳票に認識対象の項⽬が10件あった場合 ここに開発者側とユーザー側の認識の差がある 精度90%とは?
#RPALT Presented by 精度はどうやって計測するの? 帳票を スキャンして ジジって 確認 AI-OCRの⼀般的な運⽤フロー
#RPALT Presented by 精度はどうやって計測するの? 精度90%と聞いていたので、 9/10件は確認しなくて良いと思っていたのに… 結局全部確認しなくちゃいけないの!!??
#RPALT Presented by 精度はどうやって計測するの? 全部確認が必要ですが、 全部でもない!! と⾔うのが本当のところ どゆこと!!??
#RPALT Presented by 精度はどうやって計測するの? AI-OCRはたくさんのデータで学習をして、 たくさんのデータでテストをしています 苦⼿な点を明確にルール化 しやすい!
#RPALT Presented by 精度はどうやって計測するの? 例えば 君の場合 なぜか郵便記号「〒」が 認識出来ない カタカタの「テ」と 認識してしまう
似た⽂字の誤認識問題は あるある!
#RPALT Presented by 精度はどうやって計測するの? この場合 君は毎回「テ」と認識します そのため、住所で、後続が数字の場合は「テ」を「〒」へ置換する と⾔うルールが出来ます ルール化出来れば、補正辞書が使えます AI-OCRベンダーに⾔えば、おそらく後処理で対応してくれます
ボクらも 精度上げたい
#RPALT Presented by たくさんのデータがあるからこそ、苦⼿な点が明確になっている 使えば使うほど、苦⼿な点を把握出来るので 確認にかかる時間は少なくなります 精度はどうやって計測するの? ⼤変なのは 把握するまで!!??
#RPALT Presented by 各社のAI-OCRサービスは、絶対強みと弱みがあります 精度に惑わされず、⾃社の帳票に合わせて、 きちんとベンダー選定をすることが⼤事です 精度はどうやって計測するの? 強みと弱み!!??
#RPALT Presented by 私はしばしば数字に惑わされる。 ⾃分⾃⾝に当てはめる場合はなおさらだ。 ディズレイリの⾔葉「嘘には三種類ある:嘘、 まっかな嘘、そして統計」が正当性と説得⼒を もって通⽤してしまうんだ。 マーク・トウェイン トム・ソーヤーの冒険の
著者だぞう!!
#RPALT Presented by 出典元: ASIA FUTURE https://www.asia-future.com/statistics
#RPALT Presented by Plese join slack for Jijilla!! ジジラくんへの質問
#RPALT ちなみに Powered by いらすとや ではない ジジラくん募集中です!! Presented by 誰かデザインして!
None