Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VisionKit_Basics.pdf
Search
Kohei Arai
June 26, 2019
Technology
0
190
VisionKit_Basics.pdf
Kohei Arai
June 26, 2019
Tweet
Share
More Decks by Kohei Arai
See All by Kohei Arai
CoreMLで実現する爆速のARサイズ計測
kokoheia
1
2k
Swift5_Cheet_Sheet.pdf
kokoheia
7
1.4k
Other Decks in Technology
See All in Technology
GitHub Copilot CLI で Azure Portal to Bicep
tsubakimoto_s
0
270
LLMに何を任せ、何を任せないか
cap120
10
5.9k
来期の評価で変えようと思っていること 〜AI時代に変わること・変わらないこと〜
estie
0
110
MIX AUDIO EN BROADCAST
ralpherick
0
110
RGBに陥らないために -プロダクトの価値を届けるまで-
righttouch
PRO
0
120
Phase08_クイックウィン実装
overflowinc
0
2k
Change Calendarで今はOK?を仕組みにする
tommy0124
1
120
Phase09_自動化_仕組み化
overflowinc
0
1.9k
OPENLOGI Company Profile for engineer
hr01
1
61k
Blue/Green Deployment を用いた PostgreSQL のメジャーバージョンアップ
kkato1
0
150
OpenClawでPM業務を自動化
knishioka
1
280
【社内勉強会】新年度からコーディングエージェントを使いこなす - 構造と制約で引き出すClaude Codeの実践知
nwiizo
27
13k
Featured
See All Featured
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
460
How STYLIGHT went responsive
nonsquared
100
6k
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Darren the Foodie - Storyboard
khoart
PRO
3
3k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
480
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
Visualization
eitanlees
150
17k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
200
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
What's in a price? How to price your products and services
michaelherold
247
13k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.1k
Transcript
VisionKit Basics Kohei Arai @kokoheia iOS 13 update (petit)
Kohei Arai @kokoheia • Mercari / 新卒 iOS Engineer •
Twitter: @kokoheia • Instagram: @kokoheia • 趣味でポートレート撮ってます • 最近Looking Glass買いました
iOS13発表!!
Swift UI combine CoreML 3 ARKit 3 Sign in with
Apple RealityKit Audio ...
目立ちたがりなアップデート多し!
今日は、めちゃくちゃ注目されてるわけじゃないけど面白そ うだと思ったフレームワークを紹介します
VisionKit “Use the iOS camera to scan documents like those
you capture in the Notes app.” (Apple公式 Documentより)
• iOS13からNotesアプリに搭載されるOCRの機能を提供してくれ ている • 数行のコードで非常にシンプルに使うことができる • Beta版でまだ改善中のよう OCRにより画像とその内容 を読み取ることができる機能
1. VNDocumentCameraViewController 2. VNDocumentCameraViewControllerDelegate 3. VNDocumentCameraScan 2 Classes + 1
Protocol
• 社会人向けの名刺管理アプリ • 大学生向けの授業ノート交換アプリ • フリマアプリの商品情報入力取得 • ホワイトボードのスクショ画像をテキストベースで検 索 •
and so on... 用例はたくさんありそう
実際に作ってみた
Demo https://github.com/kokoheia/VisionKit-Sample
書いているのは3つのDelegate method のみ
VNDocumentCameraViewController (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraViewController Delegate (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraScan (https://developer.apple.com/documentation/visionkitより)
• Good Points ♂ ◦ とにかくにシンプルに使える • Bad Points ♂
◦ カスタマイズ性にかける ◦ 画像からタイトルしか読み取れないのはつらみ ◦ 文字認識の精度低い(今の所) ◦ Beta版のバグが多い 実際に使ってみて
改善してほしいバグ 1. Save Buttonを押した時にdismissする処理(didFinishWith)は自 分で書く必要がある。 (じゃないとクラッシュする) 2. 写真編集画面でDoneボタンを押すとクラッシュする 3. 画像のデータがうまく読み込めていないようでちゃんと表示でき
ない 4. 何回読み取っても Title を取得することができない
Notesアプリでは動いている
None
これからの改善に期待!
ご清聴ありがとうございました。
• https://developer.apple.com/documentation/ visionkit 参考 • https://github.com/kokoheia/VisionKit-Sample サンプルコード • https://qiita.com/kokoheia/items/1e5a7980d7a46cacb209 Qiita
記事