Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
Search
RPACommunity
September 12, 2019
Technology
0
410
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
RPACommunity
September 12, 2019
Tweet
Share
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
960
201023 DX Suiteを触ってみた Ayy
rpabank
0
950
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
570
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
550
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
620
201018 RPAの本質とトレンド Mitz
rpabank
0
470
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
420
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
410
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
380
Other Decks in Technology
See All in Technology
Storybook との上手な向き合い方を考える
re_taro
5
1.7k
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
2
240
Python(PYNQ)がテーマのAMD主催のFPGAコンテストに参加してきた
iotengineer22
0
550
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
140
静的解析で実現した効率的なi18n対応の仕組みづくり
minako__ph
1
220
SDN の Hype Cycle を一通り経験してみて思うこと / Going through the Hype Cycle of SDN
mshindo
1
190
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
720
Amplify Gen2 Deep Dive / バックエンドの型をいかにしてフロントエンドへ伝えるか #TSKaigi #TSKaigiKansai #AWSAmplifyJP
tacck
PRO
0
410
Amazon CloudWatch Network Monitor のススメ
yuki_ink
1
210
TypeScriptの次なる大進化なるか!? 条件型を返り値とする関数の型推論
uhyo
2
1.8k
SSMRunbook作成の勘所_20241120
koichiotomo
3
180
OCI Vault 概要
oracle4engineer
PRO
0
9.8k
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
43
13k
The Invisible Side of Design
smashingmag
298
50k
Producing Creativity
orderedlist
PRO
341
39k
The Cult of Friendly URLs
andyhume
78
6k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.9k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
27
840
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
A Philosophy of Restraint
colly
203
16k
Documentation Writing (for coders)
carmenintech
65
4.4k
A Tale of Four Properties
chriscoyier
156
23k
How To Stay Up To Date on Web Technology
chriscoyier
788
250k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.8k
Transcript
AI-OCR は × 2019/9/12 @RPACommunity⼥⼦部♡RPALT⼥⼦部 vol.3♡ 株式会社アジラ 引間 明⼦ Akiko
Hikima どうやって⽂字を読み取るのか?
#RPALT Introduction ⽣命保険会社の汎⽤機(COBOL)開発、 @cosmeサロン(当時ispot)のweb・app開発、 クラウド (Salesforce)開発、LeapMindを経て、 2019/06からAsillaにJoin。 Asillaではアプリケーション事業部にて、 JijillaのPMをやってます。 兵庫県出⾝です。あいらぶ関⻄!!!
引間 明⼦ Akiko Hikima Presented by @aki8h3
#RPALT Whatʼs asilla? 画像認識技術を中⼼とした ソリューションを開発・提供する AIスタートアップ企業。 【第⼀回⼈⼯知能EXPO】株式会社アジラの⾏動認識技術デモ 2017年6⽉ 第⼀回⼈⼯知能EXPOに 「⾏動認識技術」を出展
2018年10⽉ ⼿書き⽂字OCRを 「AIビジネス展2018」 にて発表 2019年度、 経産省の【J-Startup】 に選定していただきました。 特許番号 6525181 ⾏動推定装置 特許番号 6525180 対象数特定装置 特許番号 6525179 ⾏動推定装置(背景) ⼿書き・活字に対応の AI-OCR【ジジラ】SaaS版を 2019年7⽉リリース。 ⾏動認識技術に関する特許を取得し、 画像認識技術に関する特許も出願準備中 Presented by 各種⼿書き帳票・活字帳票を読み取り、 テキスト化する⽂字認識ソリューション
#RPALT Whatʼs asilla? Presented by ⽥村淳の BUSINESS BASICに 弊社COOが出演致します! 放送は9⽉1⽇から!
Asillaメイン回は9⽉22⽇! 兵庫県出⾝!
#RPALT Presented by アジラは アジアのゴジラに なりたい!
#RPALT Presented by アジラが開発した ⽂字認識サービス 字々ラ!?ジジラ!!
#RPALT Presented by 8/27にプレスリリースを配信致しました
#RPALT Presented by RPABANKさん どうもありがとうございます RPABANKさんも気付いてくれました
#RPALT Presented by AIテクノロジーによって ⼈々が創造的で豊かな⽣活を送れるようにすること mission の
#RPALT Presented by ジジラはこのmissionの実現のため、 誰もが⼿軽に使える「やさしさ」を持って⽣まれました。 やさしいよ!
#RPALT Presented by ジジラは「やさしい」AI-OCRです ・お財布にやさしい!料⾦プラン ・計算がやさしい! わかりやすい料⾦の計算⽅法 ・様々な環境にやさしい!導⼊の柔軟性 ・みんなにやさしい! 継続的学習による読み取り精度の向上
#RPALT ジジラは4ステップで実⾏ Presented by 読み取りたい帳票の画像 を準備します 帳票画像の準備 読み取りたい帳票画像を アップロードします 読み取り結果がテキスト
化されます 帳票画像の アップロード 読み取り 読み取り結果は、確認画⾯ で修正できます 確認した結果はCSV形式で ダウンロードできます 補正と ダウンロード テンプレートに使⽤する 帳票を登録し、読み取る 位置と項⽬を設定します テンプレートの 登録
#RPALT 導⼊時のよくあるお悩み Presented by どうやったら精度100%になるの??
#RPALT 導⼊時のよくあるお悩み Presented by 今どのように運⽤していますか? 精度100%で運⽤出来ているのであれば、 AI-OCRを導⼊する必要ありますか? でもきっと今の運⽤に無理がある…ので、 ⻑期的な運⽤は難しく、 AI-OCRの導⼊を検討しているのですよね?
#RPALT 導⼊時のよくあるお悩み Presented by 全ての⽂字の特徴を捉えることが出来たら (理論的には)精度は100%となります でもその前に、 AI-OCRがなぜ⽂字を読み取れるのか 知っていますか?
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by AI-OCR、もといAIは事前に学習を⾏います 学習とは、 ⼤量の学習データと教師データを⾒て、 AIが⾃動的に そのデータの特徴を捉えることです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 学習データ=画像データ 教師データ=テキストデータ 2019 8840 070 12
022 15 画像データと答えである 教師データを⾒ながら ⾃動で⽂字の特徴を捉える ※画像はイメージです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 2019 8840 070 12 022 15
0は丸? 1は縦線に 似てる? 9は上に 丸がある? 8は上下に 丸が2つ並んでる? 学習中…Training… 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT もし学習データに間違いがあったら Presented by 2919 8840 079 12 092 15
間違えた特徴を 捉えてしまう 丸が1個あったら9? c 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 学習データに間違いがなくても Presented by 198-8041 0 R60年12⽉30⽇ 15 学習データに共通点(特徴)が ない場合、AIは混乱します
5 8と0の違いが わからない? 5の共通点が ない? 0だけど6 みたい? 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 精度100%にならない訳 Presented by 読み取れない(精度100%とならない) ⽂字がある理由は、 ⽂字としての特徴を捉えていない⽂字が 存在するからです
#RPALT 導⼊時のよくあるお悩み Presented by 今毎⽇データ⼊⼒してるけど、 AI-OCR導⼊したらその仕事なくなるよね
#RPALT 導⼊時のよくあるお悩み Presented by AI-OCR、もといAIは ⼈間をサポートする役割です AIをマネジメントする⼈間が必要です
#RPALT AI-OCR導⼊前 Presented by データ⼊⼒部隊 RPA
#RPALT AI-OCR導⼊後 Presented by データ⼊⼒部隊 RPA AIを 管理する AIが 助けてくれる
#RPALT AIとは? あなたにとって代わる技術ではなく あなたに寄り添う技術です Presented by
#RPALT AI-OCR導⼊後 Presented by ⼈的コストを削減し、 本来のコア業務へのリソース(資⾦・⼈材)の 最適化を実現したい AI-OCR は! は!
は!
#RPALT こんな⼈たちにも使って欲しい! Presented by ⼿書きの⽇報や伝票で運⽤している 介護、医療、運送業界の⽅々
#RPALT ジジラの開発コンセプト Presented by ただの⽩紙に⼿書きで書き込まれた 「フリーフォーマット」の帳票を読み取ることを⽬標に ジジラの開発は始まりました
#RPALT ジジラの開発コンセプト Presented by ⼿書きの⽇報や伝票の運⽤を⼀度はシステム化しようと 検討して上⼿くいかず、 そのまま⼿書き運⽤を続けている⽅にぜひ使って欲しい
#RPALT 今後のジジラの⽬標 Presented by 罫線のない手書きのFAXを読み取ること 学習中!
#RPALT 本⽇伝えたかったこと Presented by AIが読み取れない⽂字は、 ⽂字としての特徴が存在していないから! AIは⼈を助ける技術なので、 AIを管理する⼈が必要! おまけ! AI-OCR
は、今後もどんどん賢くなるよ!
#RPALT なんでも読み取るAI-OCRを⽬指し、 やさしいAI-OCRジジラくんは成⻑していきます Presented by 成⻑中!
#RPALT ちなみに Powered by いらすとや ではない ジジラくん募集中です!! Presented by 誰かデザインして!
#RPALT やば…!!⼥⼦会なのに⼥⼦ネタがない…!! Engineer界隈、もといAI界隈は ⼥⼦が圧倒的に少ないのでみんな⼥⼦に異様に優しいです! 圧倒的おすすめ業界!! Presented by
None