Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
first step of ML Kit
Search
Yuki Anzai
August 01, 2018
Technology
0
2.6k
first step of ML Kit
Yuki Anzai
August 01, 2018
Tweet
Share
More Decks by Yuki Anzai
See All by Yuki Anzai
アプリをリリースできる状態に保ったまま 段階的にリファクタリングするための 戦略と戦術 / Strategies and tactics for incremental refactoring
yanzm
8
3.6k
Kotlinらしいコードを書こう - Convert Java File to Kotlin File のあとにやること / What to do after Convert Java File to Kotlin File
yanzm
1
4.7k
個人アプリ開発 (メンテナンス) 14年の歴史 / My personal app development history
yanzm
1
850
Material 3 やめました / Good-bye M3 design system
yanzm
4
7.6k
Compose Multiplatform で Bluesky のクライアント作ってみた / Bluesky client with Compose Multiplatform
yanzm
0
590
Compose Transition Animation
yanzm
3
700
Material3 with Jetpack Compose
yanzm
3
3.8k
Jetpack Compose 1.2 新機能 / new features of Jetpack Compose 1.2
yanzm
0
490
Now in Android アプリ解説 / Now in Android App
yanzm
2
1.8k
Other Decks in Technology
See All in Technology
The Role of Developer Relations in AI Product Success.
giftojabu1
0
120
IBC 2024 動画技術関連レポート / IBC 2024 Report
cyberagentdevelopers
PRO
0
110
BLADE: An Attempt to Automate Penetration Testing Using Autonomous AI Agents
bbrbbq
0
300
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
DMARC 対応の話 - MIXI CTO オフィスアワー #04
bbqallstars
1
160
エンジニア人生の拡張性を高める 「探索型キャリア設計」の提案
tenshoku_draft
1
120
Making your applications cross-environment - OSCG 2024 NA
salaboy
0
190
Lambdaと地方とコミュニティ
miu_crescent
2
370
Amplify Gen2 Deep Dive / バックエンドの型をいかにしてフロントエンドへ伝えるか #TSKaigi #TSKaigiKansai #AWSAmplifyJP
tacck
PRO
0
380
Platform Engineering for Software Developers and Architects
syntasso
1
520
スクラム成熟度セルフチェックツールを作って得た学びとその活用法
coincheck_recruit
1
140
Lexical Analysis
shigashiyama
1
150
Featured
See All Featured
RailsConf 2023
tenderlove
29
900
A Tale of Four Properties
chriscoyier
156
23k
Code Reviewing Like a Champion
maltzj
520
39k
Done Done
chrislema
181
16k
BBQ
matthewcrist
85
9.3k
What's in a price? How to price your products and services
michaelherold
243
12k
5 minutes of I Can Smell Your CMS
philhawksworth
202
19k
Agile that works and the tools we love
rasmusluckow
327
21k
Statistics for Hackers
jakevdp
796
220k
Designing for humans not robots
tammielis
250
25k
A better future with KSS
kneath
238
17k
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
Transcript
ML Kit の概要と Base API Yuki Anzai @yanzm Google Developers
Expert for Android
ML Kit とは • Firebase の機能の⼀つ • 機械学習を利⽤する機能をアプリに簡単に組み込むためのモバイル SDK •
現在は β • iOS と Android で使える • https://firebase.google.com/docs/ml-kit/
on-device or in the cloud On-device Cloud Text recognition :
テキスト認識 O O Face detection : 顔検出 O - Barcode scanning : バーコードスキャン O - Image labeling : 画像のラベル付け O O Landmark recognition : ランドマーク認識 - O Custom model inference : カスタムモデル推論 O -
on-device vs Cloud • on-device API • ローカルで動作、速い • Firebase
が機械学習のモデルをあらかじめダウンロードしてくれる • Cloud API • サーバーで処理、⾼機能 • ネットワーク接続が必要
Pricing https://firebase.google.com/pricing/ your account's first 1000 Cloud Vision API calls/month
are free
• Features • 画像からテキストを認識 • on-device API • 無料 •
全てのラテン⽂字を認識 • Cloud API • 毎⽉最初の 1000 API call は無料(1000+ からは従量課⾦) • 50 をこえる⾔語を認識(⽇本語含む) Text recognition (OCR) : テキスト認識
None
None
• Features • on-device API のみ • 顔の領域、ランドマーク(⽬・頬・⿐・⽿・⼝)の位置認識 • 顔の表情(⽬の開閉度合い、笑顔の度合い)の認識
• 動画のフレーム間で同じ顔をトラック可能 • 100以上の点から構成される2次元の輪郭情報(顔の外郭・⽬・眉・⿐・⼝) Face detection : 顔検出
Face contour https://firebase.google.com/docs/ml-kit/detect-faces
• Features • on-device API のみ • ほとんどの標準フォーマットをサポート • 1次元フォーマット
: Codabar, Code 39, Code 93, Code 128, EAN-8, EAN-13, ITF, UPC-A, UPC-E • 2次元フォーマット : Aztec, Data Matrix, PDF417, QR Code • ⾃動フォーマット検出 • structured data の取り出し • バーコードの向きによらず検出可能 Barcode scanning : バーコードスキャン
format : 256 valueType : 9 rawValue : WIFI:S:SB1Guest;P:12345;T:WEP;; displayValue
: SB1Guest 12345 boundingBox : Rect(300, 457 - 669, 824) encryptionType : 3 ssid : SB1Guest password : 12345
• Features • 画像の内容を解析し、認識したもののラベルをつける : ⼈、物、場所、活動など • on-device API •
無料 • 400+ labels をサポート • Cloud API • 毎⽉最初の 1000 API call は無料(1000+ からは従量課⾦) • 10,000+ labels をサポート Image labeling : 画像のラベル付け
label : Building confidence : 0.77894384 entityId : /m/0cgh4 label
: Palace confidence : 0.75397676 entityId : /m/05zp8 label : landmark confidence : 0.9432406 entityId : /m/05_5t0l label : town confidence : 0.9333225 entityId : /m/0dx1j
label : Food confidence : 0.9649049 entityId : /m/02wbm label
: Cuisine confidence : 0.91778296 entityId : /m/01ykh label : food confidence : 0.9399401 entityId : /m/02wbm label : cuisine confidence : 0.9263104 entityId : /m/01ykh
val options = FirebaseVisionLabelDetectorOptions .Builder() .setConfidenceThreshold(0.9f) .build()
• Features • 画像から有名なランドマークを認識 • ランドマーク名 • 地理座標 • Knowledge
Graph entity ID • 画像内でのランドマークの領域 • 毎⽉最初の 1000 API call は無料(1000+ からは従量課⾦) Landmark detection : ランドマーク認識
landmark : Amsterdam Centraal Railway Station confidence : 0.86155003 entityId
: /m/0bbw52 locations : 52.378068, 4.899774 boundingBox : Rect(33, 504 - 956, 928) landmark : Amsterdam confidence : 0.5167069 entityId : /m/0k3p locations : 52.373811, 4.890951 boundingBox : Rect(187, 644 - 757, 843)
カスタムモデル推論 • Firebase で TensorFlow Lite のモデルをホスティング • Firebase SDK
がモデルのダウンロードをハンドリング • モデルの更新も可能 • apk にバンドルしたモデルを Firebase SDK 経由で利⽤することも可能 • on-device API として利⽤