Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
Search
RPACommunity
September 12, 2019
Technology
0
350
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
190912 AI-OCRはどうやって文字を読み取るのか 株式会社アジラ_ジジラ 引間明子
RPACommunity
September 12, 2019
Tweet
Share
More Decks by RPACommunity
See All by RPACommunity
201023 Automation Anywhere「A2019」を触ってみた Ayy
rpabank
0
930
201023 DX Suiteを触ってみた Ayy
rpabank
0
920
201023 RPA超初心者がWinActorにチャレンジしてみた ユーコさん
rpabank
0
560
201023 PowerPlatform はじめの一歩 みさみささん
rpabank
0
510
201023 アシロボで実際に沼ってみた たまいさん
rpabank
0
590
201018 RPAの本質とトレンド Mitz
rpabank
0
440
201006 僕がいまRPAで伝えたいことのすべて いろはまるさん
rpabank
0
400
201006 UiPath MVP 2019-2020 はなっち!さん
rpabank
0
390
201006 今からでも間に合う!UiPathトーク一気に振り返り たまいさん
rpabank
0
340
Other Decks in Technology
See All in Technology
How to do well in consulting–Balkan Ruby 2024
irinanazarova
0
150
開発パフォーマンスを最大化するための開発体制
ham0215
7
1.1k
競技としてのKaggle、役に立つKaggle
yu4u
6
2.4k
AWS学習者向けにAzureの解説スライドを作成した話
handy
3
200
令和最新版 Ruby プロファイラ "Pf2" のご紹介
osyoyu
0
130
MapLibreとAmazon Location Service
dayjournal
1
190
データベース03: 関係データモデル
trycycle
0
100
チームでロジカルシンキングに改めて向き合っている話 〜学習環境と実践⽅法〜
sansantech
PRO
3
3.3k
M&A戦略を支えるデータマネジメント (MIDAS Tech Study #16 GENDA Komiyama)
kommy339
1
120
LangSmith入門―トレース/評価/プロンプト管理などを担うLLMアプリ開発プラットフォーム
os1ma
5
740
Tellus の衛星データを見てみよう #mf_fukuoka
kongmingstrap
0
280
成長をサポートするピープルマネジメントのやり方
sioncojp
9
1.2k
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
457
32k
How to train your dragon (web standard)
notwaldorf
75
5.2k
Testing 201, or: Great Expectations
jmmastey
30
6.4k
Typedesign – Prime Four
hannesfritz
36
2.1k
What's new in Ruby 2.0
geeforr
337
31k
Fireside Chat
paigeccino
22
2.6k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
245
20k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
242
1.2M
Bootstrapping a Software Product
garrettdimon
PRO
302
110k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
11
1k
Visualization
eitanlees
137
14k
Docker and Python
trallard
35
2.7k
Transcript
AI-OCR は × 2019/9/12 @RPACommunity⼥⼦部♡RPALT⼥⼦部 vol.3♡ 株式会社アジラ 引間 明⼦ Akiko
Hikima どうやって⽂字を読み取るのか?
#RPALT Introduction ⽣命保険会社の汎⽤機(COBOL)開発、 @cosmeサロン(当時ispot)のweb・app開発、 クラウド (Salesforce)開発、LeapMindを経て、 2019/06からAsillaにJoin。 Asillaではアプリケーション事業部にて、 JijillaのPMをやってます。 兵庫県出⾝です。あいらぶ関⻄!!!
引間 明⼦ Akiko Hikima Presented by @aki8h3
#RPALT Whatʼs asilla? 画像認識技術を中⼼とした ソリューションを開発・提供する AIスタートアップ企業。 【第⼀回⼈⼯知能EXPO】株式会社アジラの⾏動認識技術デモ 2017年6⽉ 第⼀回⼈⼯知能EXPOに 「⾏動認識技術」を出展
2018年10⽉ ⼿書き⽂字OCRを 「AIビジネス展2018」 にて発表 2019年度、 経産省の【J-Startup】 に選定していただきました。 特許番号 6525181 ⾏動推定装置 特許番号 6525180 対象数特定装置 特許番号 6525179 ⾏動推定装置(背景) ⼿書き・活字に対応の AI-OCR【ジジラ】SaaS版を 2019年7⽉リリース。 ⾏動認識技術に関する特許を取得し、 画像認識技術に関する特許も出願準備中 Presented by 各種⼿書き帳票・活字帳票を読み取り、 テキスト化する⽂字認識ソリューション
#RPALT Whatʼs asilla? Presented by ⽥村淳の BUSINESS BASICに 弊社COOが出演致します! 放送は9⽉1⽇から!
Asillaメイン回は9⽉22⽇! 兵庫県出⾝!
#RPALT Presented by アジラは アジアのゴジラに なりたい!
#RPALT Presented by アジラが開発した ⽂字認識サービス 字々ラ!?ジジラ!!
#RPALT Presented by 8/27にプレスリリースを配信致しました
#RPALT Presented by RPABANKさん どうもありがとうございます RPABANKさんも気付いてくれました
#RPALT Presented by AIテクノロジーによって ⼈々が創造的で豊かな⽣活を送れるようにすること mission の
#RPALT Presented by ジジラはこのmissionの実現のため、 誰もが⼿軽に使える「やさしさ」を持って⽣まれました。 やさしいよ!
#RPALT Presented by ジジラは「やさしい」AI-OCRです ・お財布にやさしい!料⾦プラン ・計算がやさしい! わかりやすい料⾦の計算⽅法 ・様々な環境にやさしい!導⼊の柔軟性 ・みんなにやさしい! 継続的学習による読み取り精度の向上
#RPALT ジジラは4ステップで実⾏ Presented by 読み取りたい帳票の画像 を準備します 帳票画像の準備 読み取りたい帳票画像を アップロードします 読み取り結果がテキスト
化されます 帳票画像の アップロード 読み取り 読み取り結果は、確認画⾯ で修正できます 確認した結果はCSV形式で ダウンロードできます 補正と ダウンロード テンプレートに使⽤する 帳票を登録し、読み取る 位置と項⽬を設定します テンプレートの 登録
#RPALT 導⼊時のよくあるお悩み Presented by どうやったら精度100%になるの??
#RPALT 導⼊時のよくあるお悩み Presented by 今どのように運⽤していますか? 精度100%で運⽤出来ているのであれば、 AI-OCRを導⼊する必要ありますか? でもきっと今の運⽤に無理がある…ので、 ⻑期的な運⽤は難しく、 AI-OCRの導⼊を検討しているのですよね?
#RPALT 導⼊時のよくあるお悩み Presented by 全ての⽂字の特徴を捉えることが出来たら (理論的には)精度は100%となります でもその前に、 AI-OCRがなぜ⽂字を読み取れるのか 知っていますか?
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by AI-OCR、もといAIは事前に学習を⾏います 学習とは、 ⼤量の学習データと教師データを⾒て、 AIが⾃動的に そのデータの特徴を捉えることです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 学習データ=画像データ 教師データ=テキストデータ 2019 8840 070 12
022 15 画像データと答えである 教師データを⾒ながら ⾃動で⽂字の特徴を捉える ※画像はイメージです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 2019 8840 070 12 022 15
0は丸? 1は縦線に 似てる? 9は上に 丸がある? 8は上下に 丸が2つ並んでる? 学習中…Training… 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT もし学習データに間違いがあったら Presented by 2919 8840 079 12 092 15
間違えた特徴を 捉えてしまう 丸が1個あったら9? c 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 学習データに間違いがなくても Presented by 198-8041 0 R60年12⽉30⽇ 15 学習データに共通点(特徴)が ない場合、AIは混乱します
5 8と0の違いが わからない? 5の共通点が ない? 0だけど6 みたい? 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 精度100%にならない訳 Presented by 読み取れない(精度100%とならない) ⽂字がある理由は、 ⽂字としての特徴を捉えていない⽂字が 存在するからです
#RPALT 導⼊時のよくあるお悩み Presented by 今毎⽇データ⼊⼒してるけど、 AI-OCR導⼊したらその仕事なくなるよね
#RPALT 導⼊時のよくあるお悩み Presented by AI-OCR、もといAIは ⼈間をサポートする役割です AIをマネジメントする⼈間が必要です
#RPALT AI-OCR導⼊前 Presented by データ⼊⼒部隊 RPA
#RPALT AI-OCR導⼊後 Presented by データ⼊⼒部隊 RPA AIを 管理する AIが 助けてくれる
#RPALT AIとは? あなたにとって代わる技術ではなく あなたに寄り添う技術です Presented by
#RPALT AI-OCR導⼊後 Presented by ⼈的コストを削減し、 本来のコア業務へのリソース(資⾦・⼈材)の 最適化を実現したい AI-OCR は! は!
は!
#RPALT こんな⼈たちにも使って欲しい! Presented by ⼿書きの⽇報や伝票で運⽤している 介護、医療、運送業界の⽅々
#RPALT ジジラの開発コンセプト Presented by ただの⽩紙に⼿書きで書き込まれた 「フリーフォーマット」の帳票を読み取ることを⽬標に ジジラの開発は始まりました
#RPALT ジジラの開発コンセプト Presented by ⼿書きの⽇報や伝票の運⽤を⼀度はシステム化しようと 検討して上⼿くいかず、 そのまま⼿書き運⽤を続けている⽅にぜひ使って欲しい
#RPALT 今後のジジラの⽬標 Presented by 罫線のない手書きのFAXを読み取ること 学習中!
#RPALT 本⽇伝えたかったこと Presented by AIが読み取れない⽂字は、 ⽂字としての特徴が存在していないから! AIは⼈を助ける技術なので、 AIを管理する⼈が必要! おまけ! AI-OCR
は、今後もどんどん賢くなるよ!
#RPALT なんでも読み取るAI-OCRを⽬指し、 やさしいAI-OCRジジラくんは成⻑していきます Presented by 成⻑中!
#RPALT ちなみに Powered by いらすとや ではない ジジラくん募集中です!! Presented by 誰かデザインして!
#RPALT やば…!!⼥⼦会なのに⼥⼦ネタがない…!! Engineer界隈、もといAI界隈は ⼥⼦が圧倒的に少ないのでみんな⼥⼦に異様に優しいです! 圧倒的おすすめ業界!! Presented by
None