Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AI-OCRはどうやって文字を読み取るのか
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
hikiaki
September 12, 2019
Technology
600
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
AI-OCRはどうやって文字を読み取るのか
hikiaki
September 12, 2019
More Decks by hikiaki
See All by hikiaki
DIGITAL WORLD ONLINE 2021 WINTER 4日前祭 コロナ撲滅DX
hikiaki
0
510
LINEで叶える、ニューノーマルな経理のカタチ
hikiaki
0
210
Introduction of LINE API at 20200930 freee×IBM×LINE勉強会
hikiaki
0
680
面倒な申請処理もLINEで自動化!eKYCforLINEBRAIN
hikiaki
0
530
Panas○nicの女子家電をドローンで飛ばしたい
hikiaki
0
690
AI-OCRはどうやって精度を計測しているか
hikiaki
0
1.5k
AI-OCRはどうやって文字を読み取るのか.pdf
hikiaki
0
690
AI-OCRベンダーがもの申す!AI-OCRの役割を理解していますか?
hikiaki
0
1.3k
AI-OCRとRPAの関係性
hikiaki
0
730
Other Decks in Technology
See All in Technology
自律型AIエージェントは何を破壊するのか
kojira
0
160
2026TECHFRESH畢業分享會 - Lightning Talk - 資料也要 CI/CD? 用 Airbyte 自動化資料同步
line_developers_tw
PRO
0
1k
AIはどのように 組織のアジリティを変えるのか?
junki
3
790
【NRUG vol.18】なぜ多くのオブザーバビリティ導入は失敗するのか
nrug_member
0
130
社内 AI エージェント Synapse と セマンティックレイヤーの育て方
hiroakis
3
1.9k
ACE-Step-1.5で見る 音楽生成AIのしくみと“破綻だけ直す”Retake機能の開発【zennfes spring 2026 登壇資料】
personabb
1
460
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
2.3k
フィジカル版Github Onshapeの紹介
shiba_8ro
0
230
Snowflakeと仲良くなる第一歩
coco_se
4
470
On-behalf-of Token exchange with AgentCore Identity
hironobuiga
2
200
新しいUbuntu/GNOMEが使いたいからXからWaylandへ移行頑張ってるの巻 2026-06-20
nobutomurata
0
100
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
680
Featured
See All Featured
Optimizing for Happiness
mojombo
378
71k
How to train your dragon (web standard)
notwaldorf
97
6.7k
Tell your own story through comics
letsgokoyo
1
950
Are puppies a ranking factor?
jonoalderson
1
3.5k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
170
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
2k
Agile that works and the tools we love
rasmusluckow
331
21k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
310
Become a Pro
speakerdeck
PRO
31
6k
Transcript
AI-OCR は × 2019/9/12 @RPACommunity⼥⼦部♡RPALT⼥⼦部 vol.3♡ 株式会社アジラ 引間 明⼦ Akiko
Hikima どうやって⽂字を読み取るのか?
#RPALT Introduction ⽣命保険会社の汎⽤機(COBOL)開発、 @cosmeサロン(当時ispot)のweb・app開発、 クラウド (Salesforce)開発、LeapMindを経て、 2019/06からAsillaにJoin。 Asillaではアプリケーション事業部にて、 JijillaのPMをやってます。 兵庫県出⾝です。あいらぶ関⻄!!!
引間 明⼦ Akiko Hikima Presented by @aki8h3
#RPALT Whatʼs asilla? 画像認識技術を中⼼とした ソリューションを開発・提供する AIスタートアップ企業。 【第⼀回⼈⼯知能EXPO】株式会社アジラの⾏動認識技術デモ 2017年6⽉ 第⼀回⼈⼯知能EXPOに 「⾏動認識技術」を出展
2018年10⽉ ⼿書き⽂字OCRを 「AIビジネス展2018」 にて発表 2019年度、 経産省の【J-Startup】 に選定していただきました。 特許番号 6525181 ⾏動推定装置 特許番号 6525180 対象数特定装置 特許番号 6525179 ⾏動推定装置(背景) ⼿書き・活字に対応の AI-OCR【ジジラ】SaaS版を 2019年7⽉リリース。 ⾏動認識技術に関する特許を取得し、 画像認識技術に関する特許も出願準備中 Presented by 各種⼿書き帳票・活字帳票を読み取り、 テキスト化する⽂字認識ソリューション
#RPALT Whatʼs asilla? Presented by ⽥村淳の BUSINESS BASICに 弊社COOが出演致します! 放送は9⽉1⽇から!
Asillaメイン回は9⽉22⽇! 兵庫県出⾝!
#RPALT Presented by アジラは アジアのゴジラに なりたい!
#RPALT Presented by アジラが開発した ⽂字認識サービス 字々ラ!?ジジラ!!
#RPALT Presented by 8/27にプレスリリースを配信致しました
#RPALT Presented by RPABANKさん どうもありがとうございます RPABANKさんも気付いてくれました
#RPALT Presented by AIテクノロジーによって ⼈々が創造的で豊かな⽣活を送れるようにすること mission の
#RPALT Presented by ジジラはこのmissionの実現のため、 誰もが⼿軽に使える「やさしさ」を持って⽣まれました。 やさしいよ!
#RPALT Presented by ジジラは「やさしい」AI-OCRです ・お財布にやさしい!料⾦プラン ・計算がやさしい! わかりやすい料⾦の計算⽅法 ・様々な環境にやさしい!導⼊の柔軟性 ・みんなにやさしい! 継続的学習による読み取り精度の向上
#RPALT ジジラは4ステップで実⾏ Presented by 読み取りたい帳票の画像 を準備します 帳票画像の準備 読み取りたい帳票画像を アップロードします 読み取り結果がテキスト
化されます 帳票画像の アップロード 読み取り 読み取り結果は、確認画⾯ で修正できます 確認した結果はCSV形式で ダウンロードできます 補正と ダウンロード テンプレートに使⽤する 帳票を登録し、読み取る 位置と項⽬を設定します テンプレートの 登録
#RPALT 導⼊時のよくあるお悩み Presented by どうやったら精度100%になるの??
#RPALT 導⼊時のよくあるお悩み Presented by 今どのように運⽤していますか? 精度100%で運⽤出来ているのであれば、 AI-OCRを導⼊する必要ありますか? でもきっと今の運⽤に無理がある…ので、 ⻑期的な運⽤は難しく、 AI-OCRの導⼊を検討しているのですよね?
#RPALT 導⼊時のよくあるお悩み Presented by 全ての⽂字の特徴を捉えることが出来たら (理論的には)精度は100%となります でもその前に、 AI-OCRがなぜ⽂字を読み取れるのか 知っていますか?
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by AI-OCR、もといAIは事前に学習を⾏います 学習とは、 ⼤量の学習データと教師データを⾒て、 AIが⾃動的に そのデータの特徴を捉えることです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 学習データ=画像データ 教師データ=テキストデータ 2019 8840 070 12
022 15 画像データと答えである 教師データを⾒ながら ⾃動で⽂字の特徴を捉える ※画像はイメージです
#RPALT AI-OCRが⽂字を読み取れる訳 Presented by 2019 8840 070 12 022 15
0は丸? 1は縦線に 似てる? 9は上に 丸がある? 8は上下に 丸が2つ並んでる? 学習中…Training… 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT もし学習データに間違いがあったら Presented by 2919 8840 079 12 092 15
間違えた特徴を 捉えてしまう 丸が1個あったら9? c 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 学習データに間違いがなくても Presented by 198-8041 0 R60年12⽉30⽇ 15 学習データに共通点(特徴)が ない場合、AIは混乱します
5 8と0の違いが わからない? 5の共通点が ない? 0だけど6 みたい? 学習データ=画像データ 教師データ=テキストデータ ※画像はイメージです
#RPALT 精度100%にならない訳 Presented by 読み取れない(精度100%とならない) ⽂字がある理由は、 ⽂字としての特徴を捉えていない⽂字が 存在するからです
#RPALT 導⼊時のよくあるお悩み Presented by 今毎⽇データ⼊⼒してるけど、 AI-OCR導⼊したらその仕事なくなるよね
#RPALT 導⼊時のよくあるお悩み Presented by AI-OCR、もといAIは ⼈間をサポートする役割です AIをマネジメントする⼈間が必要です
#RPALT AI-OCR導⼊前 Presented by データ⼊⼒部隊 RPA
#RPALT AI-OCR導⼊後 Presented by データ⼊⼒部隊 RPA AIを 管理する AIが 助けてくれる
#RPALT AIとは? あなたにとって代わる技術ではなく あなたに寄り添う技術です Presented by
#RPALT AI-OCR導⼊後 Presented by ⼈的コストを削減し、 本来のコア業務へのリソース(資⾦・⼈材)の 最適化を実現したい AI-OCR は! は!
は!
#RPALT こんな⼈たちにも使って欲しい! Presented by ⼿書きの⽇報や伝票で運⽤している 介護、医療、運送業界の⽅々
#RPALT ジジラの開発コンセプト Presented by ただの⽩紙に⼿書きで書き込まれた 「フリーフォーマット」の帳票を読み取ることを⽬標に ジジラの開発は始まりました
#RPALT ジジラの開発コンセプト Presented by ⼿書きの⽇報や伝票の運⽤を⼀度はシステム化しようと 検討して上⼿くいかず、 そのまま⼿書き運⽤を続けている⽅にぜひ使って欲しい
#RPALT 今後のジジラの⽬標 Presented by 罫線のない手書きのFAXを読み取ること 学習中!
#RPALT 本⽇伝えたかったこと Presented by AIが読み取れない⽂字は、 ⽂字としての特徴が存在していないから! AIは⼈を助ける技術なので、 AIを管理する⼈が必要! おまけ! AI-OCR
は、今後もどんどん賢くなるよ!
#RPALT なんでも読み取るAI-OCRを⽬指し、 やさしいAI-OCRジジラくんは成⻑していきます Presented by 成⻑中!
#RPALT ちなみに Powered by いらすとや ではない ジジラくん募集中です!! Presented by 誰かデザインして!
#RPALT やば…!!⼥⼦会なのに⼥⼦ネタがない…!! Engineer界隈、もといAI界隈は ⼥⼦が圧倒的に少ないのでみんな⼥⼦に異様に優しいです! 圧倒的おすすめ業界!! Presented by
None