Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
VisionKit_Basics.pdf
Search
Kohei Arai
June 26, 2019
Technology
0
150
VisionKit_Basics.pdf
Kohei Arai
June 26, 2019
Tweet
Share
More Decks by Kohei Arai
See All by Kohei Arai
CoreMLで実現する爆速のARサイズ計測
kokoheia
1
1.6k
Swift5_Cheet_Sheet.pdf
kokoheia
7
1.2k
Other Decks in Technology
See All in Technology
フロントエンド設計にモブ設計を導入してみた / 20241212_cloudsign_TechFrontMeetup
bengo4com
0
1.9k
.NET 9 のパフォーマンス改善
nenonaninu
0
710
GitHub Copilot のテクニック集/GitHub Copilot Techniques
rayuron
24
11k
小学3年生夏休みの自由研究「夏休みに Copilot で遊んでみた」
taichinakamura
0
150
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
0
190
多領域インシデントマネジメントへの挑戦:ハードウェアとソフトウェアの融合が生む課題/Challenge to multidisciplinary incident management: Issues created by the fusion of hardware and software
bitkey
PRO
2
100
Postman と API セキュリティ / Postman and API Security
yokawasa
0
200
あの日俺達が夢見たサーバレスアーキテクチャ/the-serverless-architecture-we-dreamed-of
tomoki10
0
420
OpenAIの蒸留機能(Model Distillation)を使用して運用中のLLMのコストを削減する取り組み
pharma_x_tech
4
550
LINE Developersプロダクト(LIFF/LINE Login)におけるフロントエンド開発
lycorptech_jp
PRO
0
120
DevOps視点でAWS re:invent2024の新サービス・アプデを振り返ってみた
oshanqq
0
180
コンテナセキュリティのためのLandlock入門
nullpo_head
2
320
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
159
15k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
26
1.9k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
Building Your Own Lightsaber
phodgson
103
6.1k
Visualization
eitanlees
146
15k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Site-Speed That Sticks
csswizardry
2
190
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Making the Leap to Tech Lead
cromwellryan
133
9k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Transcript
VisionKit Basics Kohei Arai @kokoheia iOS 13 update (petit)
Kohei Arai @kokoheia • Mercari / 新卒 iOS Engineer •
Twitter: @kokoheia • Instagram: @kokoheia • 趣味でポートレート撮ってます • 最近Looking Glass買いました
iOS13発表!!
Swift UI combine CoreML 3 ARKit 3 Sign in with
Apple RealityKit Audio ...
目立ちたがりなアップデート多し!
今日は、めちゃくちゃ注目されてるわけじゃないけど面白そ うだと思ったフレームワークを紹介します
VisionKit “Use the iOS camera to scan documents like those
you capture in the Notes app.” (Apple公式 Documentより)
• iOS13からNotesアプリに搭載されるOCRの機能を提供してくれ ている • 数行のコードで非常にシンプルに使うことができる • Beta版でまだ改善中のよう OCRにより画像とその内容 を読み取ることができる機能
1. VNDocumentCameraViewController 2. VNDocumentCameraViewControllerDelegate 3. VNDocumentCameraScan 2 Classes + 1
Protocol
• 社会人向けの名刺管理アプリ • 大学生向けの授業ノート交換アプリ • フリマアプリの商品情報入力取得 • ホワイトボードのスクショ画像をテキストベースで検 索 •
and so on... 用例はたくさんありそう
実際に作ってみた
Demo https://github.com/kokoheia/VisionKit-Sample
書いているのは3つのDelegate method のみ
VNDocumentCameraViewController (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraViewController Delegate (https://developer.apple.com/documentation/visionkitより)
VNDocumentCameraScan (https://developer.apple.com/documentation/visionkitより)
• Good Points ♂ ◦ とにかくにシンプルに使える • Bad Points ♂
◦ カスタマイズ性にかける ◦ 画像からタイトルしか読み取れないのはつらみ ◦ 文字認識の精度低い(今の所) ◦ Beta版のバグが多い 実際に使ってみて
改善してほしいバグ 1. Save Buttonを押した時にdismissする処理(didFinishWith)は自 分で書く必要がある。 (じゃないとクラッシュする) 2. 写真編集画面でDoneボタンを押すとクラッシュする 3. 画像のデータがうまく読み込めていないようでちゃんと表示でき
ない 4. 何回読み取っても Title を取得することができない
Notesアプリでは動いている
None
これからの改善に期待!
ご清聴ありがとうございました。
• https://developer.apple.com/documentation/ visionkit 参考 • https://github.com/kokoheia/VisionKit-Sample サンプルコード • https://qiita.com/kokoheia/items/1e5a7980d7a46cacb209 Qiita
記事