Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VisionKit_Basics.pdf
Search
Kohei Arai
June 26, 2019
Technology
210
0
Share
VisionKit_Basics.pdf
Kohei Arai
June 26, 2019
More Decks by Kohei Arai
See All by Kohei Arai
CoreMLで実現する爆速のARサイズ計測
kokoheia
1
2k
Swift5_Cheet_Sheet.pdf
kokoheia
7
1.4k
Other Decks in Technology
See All in Technology
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
220
地元にいないローカルオーガナイザーの立ち回り
uvb_76
1
470
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
210
先取りMaven4 ~16年ぶりのメジャーアップデート、その進化とは?~
ogiwarat
0
140
Unlocking the Apps
pimterry
0
220
Platform engineering for developers, architects & the rest of us (AI agents)
danielbryantuk
0
180
Javaコミュニティをもっと楽しむための9箇条
takasyou
0
1.3k
生成 AI × MCP で切り拓く次世代 SRE!自律型運用への挑戦と開発者体験の進化
_awache
0
150
はじめてのDatadog
kairim0
0
270
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
1.2k
製造業のクラウド活用最適解〜AI,DXを加速するデータ基盤の作り方〜
hamadakoji
0
360
サプライチェーンセキュリティの空白地帯 - 信頼できる”依存性”の未来を考える
rung
PRO
2
680
Featured
See All Featured
Site-Speed That Sticks
csswizardry
13
1.2k
The Pragmatic Product Professional
lauravandoore
37
7.3k
Unsuck your backbone
ammeep
672
58k
Code Reviewing Like a Champion
maltzj
528
40k
Agile that works and the tools we love
rasmusluckow
331
21k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
The Cost Of JavaScript in 2023
addyosmani
55
10k
Why Our Code Smells
bkeepers
PRO
340
58k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
320
Exploring the relationship between traditional SERPs and Gen AI search
raygrieselhuber
PRO
2
4k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
160
Transcript
VisionKit Basics Kohei Arai @kokoheia iOS 13 update (petit)
Kohei Arai @kokoheia • Mercari / 新卒 iOS Engineer •
Twitter: @kokoheia • Instagram: @kokoheia • 趣味でポートレート撮ってます • 最近Looking Glass買いました
iOS13発表!!
Swift UI combine CoreML 3 ARKit 3 Sign in with
Apple RealityKit Audio ...
目立ちたがりなアップデート多し!
今日は、めちゃくちゃ注目されてるわけじゃないけど面白そ うだと思ったフレームワークを紹介します
VisionKit “Use the iOS camera to scan documents like those
you capture in the Notes app.” (Apple公式 Documentより)
• iOS13からNotesアプリに搭載されるOCRの機能を提供してくれ ている • 数行のコードで非常にシンプルに使うことができる • Beta版でまだ改善中のよう OCRにより画像とその内容 を読み取ることができる機能
1. VNDocumentCameraViewController 2. VNDocumentCameraViewControllerDelegate 3. VNDocumentCameraScan 2 Classes + 1
Protocol
• 社会人向けの名刺管理アプリ • 大学生向けの授業ノート交換アプリ • フリマアプリの商品情報入力取得 • ホワイトボードのスクショ画像をテキストベースで検 索 •
and so on... 用例はたくさんありそう
実際に作ってみた
Demo https://github.com/kokoheia/VisionKit-Sample
書いているのは3つのDelegate method のみ
VNDocumentCameraViewController (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraViewController Delegate (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraScan (https://developer.apple.com/documentation/visionkitより)
• Good Points ♂ ◦ とにかくにシンプルに使える • Bad Points ♂
◦ カスタマイズ性にかける ◦ 画像からタイトルしか読み取れないのはつらみ ◦ 文字認識の精度低い(今の所) ◦ Beta版のバグが多い 実際に使ってみて
改善してほしいバグ 1. Save Buttonを押した時にdismissする処理(didFinishWith)は自 分で書く必要がある。 (じゃないとクラッシュする) 2. 写真編集画面でDoneボタンを押すとクラッシュする 3. 画像のデータがうまく読み込めていないようでちゃんと表示でき
ない 4. 何回読み取っても Title を取得することができない
Notesアプリでは動いている
None
これからの改善に期待!
ご清聴ありがとうございました。
• https://developer.apple.com/documentation/ visionkit 参考 • https://github.com/kokoheia/VisionKit-Sample サンプルコード • https://qiita.com/kokoheia/items/1e5a7980d7a46cacb209 Qiita
記事