Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
Search
RPACommunity
September 12, 2019
Technology
0
440
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
RPACommunity
September 12, 2019
Tweet
Share
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
1k
201023 DX Suiteを触ってみた Ayy
rpabank
0
1k
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
630
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
630
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
690
201018 RPAの本質とトレンド Mitz
rpabank
0
530
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
480
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
460
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
420
Other Decks in Technology
See All in Technology
pool.ntp.orgに ⾃宅サーバーで 参加してみたら...
tanyorg
0
1.4k
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
2.1k
量子クラウドサービスの裏側 〜Deep Dive into OQTOPUS〜
oqtopus
0
150
Greatest Disaster Hits in Web Performance
guaca
0
300
OpenShiftでllm-dを動かそう!
jpishikawa
0
140
Kiro IDEのドキュメントを全部読んだので地味だけどちょっと嬉しい機能を紹介する
khmoryz
0
210
SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜
zepprix
0
480
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
520
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
610
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
220
AIエージェントを開発しよう!-AgentCore活用の勘所-
yukiogawa
0
200
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
460
Featured
See All Featured
Navigating Weather and Climate Data
rabernat
0
110
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
440
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
52k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
780
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
SERP Conf. Vienna - Web Accessibility: Optimizing for Inclusivity and SEO
sarafernandez
1
1.3k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3k
How to Ace a Technical Interview
jacobian
281
24k
Thoughts on Productivity
jonyablonski
74
5k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Practical Orchestrator
shlominoach
191
11k
Transcript
AI-OCR は × 2019/9/12 @RPACommunity⼥⼦部♡RPALT⼥⼦部 vol.3♡ 株式会社アジラ 引間 明⼦ Akiko
Hikima どうやって⽂字を読み取るのか?
#RPALT Introduction ⽣命保険会社の汎⽤機(COBOL)開発、 @cosmeサロン(当時ispot)のweb・app開発、 クラウド (Salesforce)開発、LeapMindを経て、 2019/06からAsillaにJoin。 Asillaではアプリケーション事業部にて、 JijillaのPMをやってます。 兵庫県出⾝です。あいらぶ関⻄!!!
引間 明⼦ Akiko Hikima Presented by @aki8h3
#RPALT Whatʼs asilla? 画像認識技術を中⼼とした ソリューションを開発・提供する AIスタートアップ企業。 【第⼀回⼈⼯知能EXPO】株式会社アジラの⾏動認識技術デモ 2017年6⽉ 第⼀回⼈⼯知能EXPOに 「⾏動認識技術」を出展
2018年10⽉ ⼿書き⽂字OCRを 「AIビジネス展2018」 にて発表 2019年度、 経産省の【J-Startup】 に選定していただきました。 特許番号 6525181 ⾏動推定装置 特許番号 6525180 対象数特定装置 特許番号 6525179 ⾏動推定装置(背景) ⼿書き・活字に対応の AI-OCR【ジジラ】SaaS版を 2019年7⽉リリース。 ⾏動認識技術に関する特許を取得し、 画像認識技術に関する特許も出願準備中 Presented by 各種⼿書き帳票・活字帳票を読み取り、 テキスト化する⽂字認識ソリューション
#RPALT Whatʼs asilla? Presented by ⽥村淳の BUSINESS BASICに 弊社COOが出演致します! 放送は9⽉1⽇から!
Asillaメイン回は9⽉22⽇! 兵庫県出⾝!
#RPALT Presented by アジラは アジアのゴジラに なりたい!
#RPALT Presented by アジラが開発した ⽂字認識サービス 字々ラ!?ジジラ!!
#RPALT Presented by 8/27にプレスリリースを配信致しました
#RPALT Presented by RPABANKさん どうもありがとうございます RPABANKさんも気付いてくれました
#RPALT Presented by AIテクノロジーによって ⼈々が創造的で豊かな⽣活を送れるようにすること mission の
#RPALT Presented by ジジラはこのmissionの実現のため、 誰もが⼿軽に使える「やさしさ」を持って⽣まれました。 やさしいよ!
#RPALT Presented by ジジラは「やさしい」AI-OCRです ・お財布にやさしい!料⾦プラン ・計算がやさしい! わかりやすい料⾦の計算⽅法 ・様々な環境にやさしい!導⼊の柔軟性 ・みんなにやさしい! 継続的学習による読み取り精度の向上
#RPALT ジジラは4ステップで実⾏ Presented by 読み取りたい帳票の画像 を準備します 帳票画像の準備 読み取りたい帳票画像を アップロードします 読み取り結果がテキスト
化されます 帳票画像の アップロード 読み取り 読み取り結果は、確認画⾯ で修正できます 確認した結果はCSV形式で ダウンロードできます 補正と ダウンロード テンプレートに使⽤する 帳票を登録し、読み取る 位置と項⽬を設定します テンプレートの 登録
#RPALT 導⼊時のよくあるお悩み Presented by どうやったら精度100%になるの??
#RPALT 導⼊時のよくあるお悩み Presented by 今どのように運⽤していますか? 精度100%で運⽤出来ているのであれば、 AI-OCRを導⼊する必要ありますか? でもきっと今の運⽤に無理がある…ので、 ⻑期的な運⽤は難しく、 AI-OCRの導⼊を検討しているのですよね?
#RPALT 導⼊時のよくあるお悩み Presented by 全ての⽂字の特徴を捉えることが出来たら (理論的には)精度は100%となります でもその前に、 AI-OCRがなぜ⽂字を読み取れるのか 知っていますか?
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by AI-OCR、もといAIは事前に学習を⾏います 学習とは、 ⼤量の学習データと教師データを⾒て、 AIが⾃動的に そのデータの特徴を捉えることです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 学習データ=画像データ 教師データ=テキストデータ 2019 8840 070 12
022 15 画像データと答えである 教師データを⾒ながら ⾃動で⽂字の特徴を捉える ※画像はイメージです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 2019 8840 070 12 022 15
0は丸? 1は縦線に 似てる? 9は上に 丸がある? 8は上下に 丸が2つ並んでる? 学習中…Training… 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT もし学習データに間違いがあったら Presented by 2919 8840 079 12 092 15
間違えた特徴を 捉えてしまう 丸が1個あったら9? c 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 学習データに間違いがなくても Presented by 198-8041 0 R60年12⽉30⽇ 15 学習データに共通点(特徴)が ない場合、AIは混乱します
5 8と0の違いが わからない? 5の共通点が ない? 0だけど6 みたい? 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 精度100%にならない訳 Presented by 読み取れない(精度100%とならない) ⽂字がある理由は、 ⽂字としての特徴を捉えていない⽂字が 存在するからです
#RPALT 導⼊時のよくあるお悩み Presented by 今毎⽇データ⼊⼒してるけど、 AI-OCR導⼊したらその仕事なくなるよね
#RPALT 導⼊時のよくあるお悩み Presented by AI-OCR、もといAIは ⼈間をサポートする役割です AIをマネジメントする⼈間が必要です
#RPALT AI-OCR導⼊前 Presented by データ⼊⼒部隊 RPA
#RPALT AI-OCR導⼊後 Presented by データ⼊⼒部隊 RPA AIを 管理する AIが 助けてくれる
#RPALT AIとは? あなたにとって代わる技術ではなく あなたに寄り添う技術です Presented by
#RPALT AI-OCR導⼊後 Presented by ⼈的コストを削減し、 本来のコア業務へのリソース(資⾦・⼈材)の 最適化を実現したい AI-OCR は! は!
は!
#RPALT こんな⼈たちにも使って欲しい! Presented by ⼿書きの⽇報や伝票で運⽤している 介護、医療、運送業界の⽅々
#RPALT ジジラの開発コンセプト Presented by ただの⽩紙に⼿書きで書き込まれた 「フリーフォーマット」の帳票を読み取ることを⽬標に ジジラの開発は始まりました
#RPALT ジジラの開発コンセプト Presented by ⼿書きの⽇報や伝票の運⽤を⼀度はシステム化しようと 検討して上⼿くいかず、 そのまま⼿書き運⽤を続けている⽅にぜひ使って欲しい
#RPALT 今後のジジラの⽬標 Presented by 罫線のない手書きのFAXを読み取ること 学習中!
#RPALT 本⽇伝えたかったこと Presented by AIが読み取れない⽂字は、 ⽂字としての特徴が存在していないから! AIは⼈を助ける技術なので、 AIを管理する⼈が必要! おまけ! AI-OCR
は、今後もどんどん賢くなるよ!
#RPALT なんでも読み取るAI-OCRを⽬指し、 やさしいAI-OCRジジラくんは成⻑していきます Presented by 成⻑中!
#RPALT ちなみに Powered by いらすとや ではない ジジラくん募集中です!! Presented by 誰かデザインして!
#RPALT やば…!!⼥⼦会なのに⼥⼦ネタがない…!! Engineer界隈、もといAI界隈は ⼥⼦が圧倒的に少ないのでみんな⼥⼦に異様に優しいです! 圧倒的おすすめ業界!! Presented by
None