Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VisionKit_Basics.pdf
Search
Kohei Arai
June 26, 2019
Technology
200
0
Share
VisionKit_Basics.pdf
Kohei Arai
June 26, 2019
More Decks by Kohei Arai
See All by Kohei Arai
CoreMLで実現する爆速のARサイズ計測
kokoheia
1
2k
Swift5_Cheet_Sheet.pdf
kokoheia
7
1.4k
Other Decks in Technology
See All in Technology
GitHub Copilot Dev Days
tomokusaba
0
120
『生成AI時代のクレデンシャルとパーミッション設計 — Claude Code を起点に』の執筆企画
takuros
2
1.8k
AIと乗り切った1,500ページ超のヘルプサイト基盤刷新とさらにその先の話
mugi_uno
0
130
Pure Intonation on Browser: Building a Sequencer with Ruby
nagachika
0
390
ファインディの事業拡大を支える 拡張可能なデータ基盤へのリアーキテクチャ
hiracky16
0
670
【技術書典20】OpenFOAM(自宅で深める流体解析)流れと熱移動(2)
kamakiri1225
0
350
FessのAI検索モード:検索システムとLLMへの取り組み
marevol
0
150
Chasing Real-Time Observability for CRuby
whitegreen
0
610
Scovilleモバイルエンジニア募集中.pdf
julienrudin
0
140
COBOL婆さんの伝説
poropinai1966
0
130
Keeping Ruby Running on Cygwin
fd0
0
190
コードや知識を組み込む / Incorporate Code and Knowledge
ks91
PRO
0
190
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
28
2.6k
Between Models and Reality
mayunak
3
270
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
900
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.5k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.3k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Google's AI Overviews - The New Search
badams
0
990
My Coaching Mixtape
mlcsv
0
110
A Soul's Torment
seathinner
6
2.7k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Transcript
VisionKit Basics Kohei Arai @kokoheia iOS 13 update (petit)
Kohei Arai @kokoheia • Mercari / 新卒 iOS Engineer •
Twitter: @kokoheia • Instagram: @kokoheia • 趣味でポートレート撮ってます • 最近Looking Glass買いました
iOS13発表!!
Swift UI combine CoreML 3 ARKit 3 Sign in with
Apple RealityKit Audio ...
目立ちたがりなアップデート多し!
今日は、めちゃくちゃ注目されてるわけじゃないけど面白そ うだと思ったフレームワークを紹介します
VisionKit “Use the iOS camera to scan documents like those
you capture in the Notes app.” (Apple公式 Documentより)
• iOS13からNotesアプリに搭載されるOCRの機能を提供してくれ ている • 数行のコードで非常にシンプルに使うことができる • Beta版でまだ改善中のよう OCRにより画像とその内容 を読み取ることができる機能
1. VNDocumentCameraViewController 2. VNDocumentCameraViewControllerDelegate 3. VNDocumentCameraScan 2 Classes + 1
Protocol
• 社会人向けの名刺管理アプリ • 大学生向けの授業ノート交換アプリ • フリマアプリの商品情報入力取得 • ホワイトボードのスクショ画像をテキストベースで検 索 •
and so on... 用例はたくさんありそう
実際に作ってみた
Demo https://github.com/kokoheia/VisionKit-Sample
書いているのは3つのDelegate method のみ
VNDocumentCameraViewController (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraViewController Delegate (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraScan (https://developer.apple.com/documentation/visionkitより)
• Good Points ♂ ◦ とにかくにシンプルに使える • Bad Points ♂
◦ カスタマイズ性にかける ◦ 画像からタイトルしか読み取れないのはつらみ ◦ 文字認識の精度低い(今の所) ◦ Beta版のバグが多い 実際に使ってみて
改善してほしいバグ 1. Save Buttonを押した時にdismissする処理(didFinishWith)は自 分で書く必要がある。 (じゃないとクラッシュする) 2. 写真編集画面でDoneボタンを押すとクラッシュする 3. 画像のデータがうまく読み込めていないようでちゃんと表示でき
ない 4. 何回読み取っても Title を取得することができない
Notesアプリでは動いている
None
これからの改善に期待!
ご清聴ありがとうございました。
• https://developer.apple.com/documentation/ visionkit 参考 • https://github.com/kokoheia/VisionKit-Sample サンプルコード • https://qiita.com/kokoheia/items/1e5a7980d7a46cacb209 Qiita
記事