Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AmazonTextractの信頼スコアはどれくらい信頼できるのか
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
n-oshiumi
July 31, 2019
Technology
820
0
Share
AmazonTextractの信頼スコアはどれくらい信頼できるのか
RPA COMMUNITYのRPALT vol.12の資料です。
n-oshiumi
July 31, 2019
More Decks by n-oshiumi
See All by n-oshiumi
UiPathの単体テストのお話
oshiumi
0
900
疑問・知識・経験をもっとオープンに
oshiumi
0
840
最近なーんとなく考えていること。○○vs○○
oshiumi
0
330
Other Decks in Technology
See All in Technology
タスク管理も1on1も、もう「管理」じゃない - KiroとBedrock AgentCoreで変わった“判断の仕事”
yusukeshimizu
0
150
来期の評価で変えようと思っていること 〜AI時代に変わること・変わらないこと〜
estie
0
130
不確実性と戦いながら見積もりを作成するプロセス/mitsumori-process
hirodragon112
1
160
CloudFrontのHost Header転送設定でパケットの中身はどう変わるのか?
nagisa53
1
230
40代からのアウトプット ― 経験は価値ある学びに変わる / 20260404 Naoki Takahashi
shift_evolve
PRO
3
460
Bref でサービスを運用している話
sgash708
0
220
契約書からの情報抽出を行うLLMのスループットを、バッチ処理を用いて最大40%改善した話
sansantech
PRO
3
330
SSoT(Single Source of Truth)で「壊して再生」する設計
kawauso
2
400
SaaSの操作主体は人間からAIへ - 経理AIエージェントが目指す深い自動化
nishihira
0
130
GitHub Copilot CLI で Azure Portal to Bicep
tsubakimoto_s
0
300
JEDAI認定プログラム JEDAI Order 2026 受賞者一覧 / JEDAI Order 2026 Winners
databricksjapan
0
410
ブラックボックス化したMLシステムのVertex AI移行 / mlops_community_62
visional_engineering_and_design
1
240
Featured
See All Featured
Docker and Python
trallard
47
3.8k
Test your architecture with Archunit
thirion
1
2.2k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
160
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Making the Leap to Tech Lead
cromwellryan
135
9.8k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
190
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Building Adaptive Systems
keathley
44
3k
Mobile First: as difficult as doing things right
swwweet
225
10k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Are puppies a ranking factor?
jonoalderson
1
3.2k
Transcript
Amazon Textract(OCR)の 信頼スコアを徹底調査してみた! アジアクエスト株式会社 鴛海直輝(おしうみなおき)
自己紹介 鴛海 直輝(おしうみ なおき) ▪本読む ▪ストリートダンスする ▪ Laravelでwebアプリ作る 2019年4月に新卒で入社し、 UiPathを用いていろいろ経験中
今日はRPALT初登壇!!
目次 1. Amazon Textractとは 2. 信頼スコアはどれほど信頼できるのか 3. まとめ
1. Amazon Textractとは
1. Amazon Textractとは 【概要】 AmazonのOCRサービス 2019年5月に一般公開された 【特徴】 ・クラウド上で動く ・APIも使える ・値段が安い!(従量課金制)
・AIでフォームや表を読み取ることができる ・信頼スコアが分かる ・手書きは対応していない ・まだ日本語対応されていない
とにかく安い! API 料金 Detect Document API (文字を読み取る) 約0.16円 / ページ
Analyze Document API (文字とフォームを読み取る) 約1.62円 / ページ Analyze Document API (文字と表を読み取る) 約5.39 円 / ページ Analyze Document API (文字とフォームと表を読み取る) 約7.01円 / ページ ※100万ページまでの料金
「信頼スコア」とは ▪OCRで読み取ったテキストの正確性を表す ▪0~100の間の数字 Amazon Textract テキスト :kasutera 信頼スコア:96.8 ※画像です
信頼スコアで目視確認が楽になる!? 【今】 OCRで紙資料を 読み取る RPAで処理する 目視で確認する 信頼スコアが特定の値を下回ったら警告を出すようにす れば、目視確認が楽になる OK
信頼スコアで目視確認が楽になる!? 【これから】 OCRで紙資料を 読み取る RPAで処理する 目視で確認する 信頼スコアが特定の値を下回ったら警告を出すようにす れば、目視確認が楽になる OK 特定の点数以下
の場合のみ
2. 信頼スコアは信頼できるのか
信頼スコアの検証方法 Amazon Textract テキスト :kasutera 信頼スコア:96.8 ※画像です 正確
Amazon Textractの信頼スコア Amazon Textract テキスト :Customer IO 信頼スコア:82.6 ※画像です 不正確
信頼スコアの検証方法 画像を読み込ませる ①単語が正確な場合 ②単語が不正確な場合 2つに分類して信頼スコアを記録 【レスポンス】 ・単語 ・信頼スコア
単語が正確な場合の検証結果 ①90点以上が約80%を占める 単語が正確な場合の信頼スコア ②50~70点台が約15%を占める 【特徴】 ▪文字サイズが小さい ▪英数字1文字
単語が不正確な場合の検証結果 ①80点以上が約79%を占める 単語が不正確な場合の信頼スコア 【特徴】 ▪1文字だけ間違っている Customer IO
単語が不正確な場合の検証結果 ①80点以上が約79%を占める 単語が不正確な場合の信頼スコア
3. まとめ
信頼スコアの傾向 【単語が正確な場合】 ①90点以上が8割 ②50~70点台が約15%を占める 【単語が不正確な場合】 ③80点以上が約79%を占める 【②の特徴】 ▪文字サイズが小さい ▪英数字1文字 【③の特徴】
▪1文字だけ間違っている Customer IO
信頼スコアは工夫すれば使える 英数字1文字のところは 信頼スコアを使用しない RPAツール側で Customer IOと読み取っても 正常に処理するよう工夫する
信頼スコアは工夫すれば使える RPAツール側で Customer IOと読み取っても 正常に処理するよう工夫する
OCRの世話をする必要がなくなる! 【これから】 OCRで紙資料を 読み取る RPAで処理する 目視で確認する 信頼スコアが特定の値を下回ったら警告を出すようにす れば、目視確認が楽になる OK 特定の点数以下
の場合のみ