Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VisionKit_Basics.pdf
Search
Kohei Arai
June 26, 2019
Technology
0
150
VisionKit_Basics.pdf
Kohei Arai
June 26, 2019
Tweet
Share
More Decks by Kohei Arai
See All by Kohei Arai
CoreMLで実現する爆速のARサイズ計測
kokoheia
1
1.7k
Swift5_Cheet_Sheet.pdf
kokoheia
7
1.3k
Other Decks in Technology
See All in Technology
AWSを活用したIoTにおけるセキュリティ対策のご紹介
kwskyk
0
350
Iceberg Meetup Japan #1 : Iceberg and Databricks
databricksjapan
0
370
【内製開発Summit 2025】イオンスマートテクノロジーの内製化組織の作り方/In-house-development-summit-AST
aeonpeople
2
660
OPENLOGI Company Profile for engineer
hr01
1
20k
急成長する企業で作った、エンジニアが輝ける制度/ 20250227 Rinto Ikenoue
shift_evolve
0
130
Exadata Database Service on Cloud@Customer セキュリティ、ネットワーク、および管理について
oracle4engineer
PRO
2
1.5k
AWSアカウントのセキュリティ自動化、どこまで進める? 最適な設計と実践ポイント
yuobayashi
7
610
AIエージェント時代のエンジニアになろう #jawsug #jawsdays2025 / 20250301 Agentic AI Engineering
yoshidashingo
8
3.7k
大規模アジャイルフレームワークから学ぶエンジニアマネジメントの本質
staka121
PRO
3
1.2k
OCI Success Journey OCIの何が評価されてる?疑問に答える事例セミナー(2025年2月実施)
oracle4engineer
PRO
2
150
Pwned Labsのすゝめ
ken5scal
2
430
AIエージェント入門
minorun365
PRO
31
18k
Featured
See All Featured
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
The World Runs on Bad Software
bkeepers
PRO
67
11k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
49
2.3k
GraphQLとの向き合い方2022年版
quramy
44
14k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
1k
GraphQLの誤解/rethinking-graphql
sonatard
68
10k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
114
50k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
45
9.4k
Agile that works and the tools we love
rasmusluckow
328
21k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.1k
Transcript
VisionKit Basics Kohei Arai @kokoheia iOS 13 update (petit)
Kohei Arai @kokoheia • Mercari / 新卒 iOS Engineer •
Twitter: @kokoheia • Instagram: @kokoheia • 趣味でポートレート撮ってます • 最近Looking Glass買いました
iOS13発表!!
Swift UI combine CoreML 3 ARKit 3 Sign in with
Apple RealityKit Audio ...
目立ちたがりなアップデート多し!
今日は、めちゃくちゃ注目されてるわけじゃないけど面白そ うだと思ったフレームワークを紹介します
VisionKit “Use the iOS camera to scan documents like those
you capture in the Notes app.” (Apple公式 Documentより)
• iOS13からNotesアプリに搭載されるOCRの機能を提供してくれ ている • 数行のコードで非常にシンプルに使うことができる • Beta版でまだ改善中のよう OCRにより画像とその内容 を読み取ることができる機能
1. VNDocumentCameraViewController 2. VNDocumentCameraViewControllerDelegate 3. VNDocumentCameraScan 2 Classes + 1
Protocol
• 社会人向けの名刺管理アプリ • 大学生向けの授業ノート交換アプリ • フリマアプリの商品情報入力取得 • ホワイトボードのスクショ画像をテキストベースで検 索 •
and so on... 用例はたくさんありそう
実際に作ってみた
Demo https://github.com/kokoheia/VisionKit-Sample
書いているのは3つのDelegate method のみ
VNDocumentCameraViewController (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraViewController Delegate (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraScan (https://developer.apple.com/documentation/visionkitより)
• Good Points ♂ ◦ とにかくにシンプルに使える • Bad Points ♂
◦ カスタマイズ性にかける ◦ 画像からタイトルしか読み取れないのはつらみ ◦ 文字認識の精度低い(今の所) ◦ Beta版のバグが多い 実際に使ってみて
改善してほしいバグ 1. Save Buttonを押した時にdismissする処理(didFinishWith)は自 分で書く必要がある。 (じゃないとクラッシュする) 2. 写真編集画面でDoneボタンを押すとクラッシュする 3. 画像のデータがうまく読み込めていないようでちゃんと表示でき
ない 4. 何回読み取っても Title を取得することができない
Notesアプリでは動いている
None
これからの改善に期待!
ご清聴ありがとうございました。
• https://developer.apple.com/documentation/ visionkit 参考 • https://github.com/kokoheia/VisionKit-Sample サンプルコード • https://qiita.com/kokoheia/items/1e5a7980d7a46cacb209 Qiita
記事