Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
first step of ML Kit
Search
Yuki Anzai
August 01, 2018
Technology
0
2.6k
first step of ML Kit
Yuki Anzai
August 01, 2018
Tweet
Share
More Decks by Yuki Anzai
See All by Yuki Anzai
MediaPipe と ML Kit ってどう ちがうの? / What is the difference between MediaPipe and ML Kit?
yanzm
0
960
アプリをリリースできる状態に保ったまま 段階的にリファクタリングするための 戦略と戦術 / Strategies and tactics for incremental refactoring
yanzm
8
4.3k
Kotlinらしいコードを書こう - Convert Java File to Kotlin File のあとにやること / What to do after Convert Java File to Kotlin File
yanzm
1
5.1k
個人アプリ開発 (メンテナンス) 14年の歴史 / My personal app development history
yanzm
1
890
Material 3 やめました / Good-bye M3 design system
yanzm
4
8.1k
Compose Multiplatform で Bluesky のクライアント作ってみた / Bluesky client with Compose Multiplatform
yanzm
0
630
Compose Transition Animation
yanzm
3
750
Material3 with Jetpack Compose
yanzm
3
4k
Jetpack Compose 1.2 新機能 / new features of Jetpack Compose 1.2
yanzm
0
530
Other Decks in Technology
See All in Technology
Cloud Spanner 導入で実現した快適な開発と運用について
colopl
1
920
一度 Expo の採用を断念したけど、 再度 Expo の導入を検討している話
ichiki1023
1
240
分解して理解する Aspire
nenonaninu
2
500
AndroidXR 開発ツールごとの できることできないこと
donabe3
0
140
Raycast AI APIを使ってちょっと便利な拡張機能を作ってみた / created-a-handy-extension-using-the-raycast-ai-api
kawamataryo
0
160
深層学習と古典的画像アルゴリズムを組み合わせた類似画像検索内製化
shutotakahashi
1
270
明日からできる!技術的負債の返済を加速するための実践ガイド~『ホットペッパービューティー』の事例をもとに~
recruitengineers
PRO
3
530
2/18/25: Java meets AI: Build LLM-Powered Apps with LangChain4j
edeandrea
PRO
0
150
Oracle Cloud Infrastructure:2025年2月度サービス・アップデート
oracle4engineer
PRO
1
350
【詳説】コンテンツ配信 システムの複数機能 基盤への拡張
hatena
0
130
NFV基盤のOpenStack更新 ~9世代バージョンアップへの挑戦~
vtj
0
290
ローカルLLMを活用したコード生成と、ローコード開発ツールへの応用
kazuhitoyokoi
0
140
Featured
See All Featured
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Writing Fast Ruby
sferik
628
61k
Code Review Best Practice
trishagee
67
18k
Done Done
chrislema
182
16k
How to Think Like a Performance Engineer
csswizardry
22
1.4k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
30
4.6k
Bash Introduction
62gerente
611
210k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
350
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Making Projects Easy
brettharned
116
6k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
Transcript
ML Kit の概要と Base API Yuki Anzai @yanzm Google Developers
Expert for Android
ML Kit とは • Firebase の機能の⼀つ • 機械学習を利⽤する機能をアプリに簡単に組み込むためのモバイル SDK •
現在は β • iOS と Android で使える • https://firebase.google.com/docs/ml-kit/
on-device or in the cloud On-device Cloud Text recognition :
テキスト認識 O O Face detection : 顔検出 O - Barcode scanning : バーコードスキャン O - Image labeling : 画像のラベル付け O O Landmark recognition : ランドマーク認識 - O Custom model inference : カスタムモデル推論 O -
on-device vs Cloud • on-device API • ローカルで動作、速い • Firebase
が機械学習のモデルをあらかじめダウンロードしてくれる • Cloud API • サーバーで処理、⾼機能 • ネットワーク接続が必要
Pricing https://firebase.google.com/pricing/ your account's first 1000 Cloud Vision API calls/month
are free
• Features • 画像からテキストを認識 • on-device API • 無料 •
全てのラテン⽂字を認識 • Cloud API • 毎⽉最初の 1000 API call は無料(1000+ からは従量課⾦) • 50 をこえる⾔語を認識(⽇本語含む) Text recognition (OCR) : テキスト認識
None
None
• Features • on-device API のみ • 顔の領域、ランドマーク(⽬・頬・⿐・⽿・⼝)の位置認識 • 顔の表情(⽬の開閉度合い、笑顔の度合い)の認識
• 動画のフレーム間で同じ顔をトラック可能 • 100以上の点から構成される2次元の輪郭情報(顔の外郭・⽬・眉・⿐・⼝) Face detection : 顔検出
Face contour https://firebase.google.com/docs/ml-kit/detect-faces
• Features • on-device API のみ • ほとんどの標準フォーマットをサポート • 1次元フォーマット
: Codabar, Code 39, Code 93, Code 128, EAN-8, EAN-13, ITF, UPC-A, UPC-E • 2次元フォーマット : Aztec, Data Matrix, PDF417, QR Code • ⾃動フォーマット検出 • structured data の取り出し • バーコードの向きによらず検出可能 Barcode scanning : バーコードスキャン
format : 256 valueType : 9 rawValue : WIFI:S:SB1Guest;P:12345;T:WEP;; displayValue
: SB1Guest 12345 boundingBox : Rect(300, 457 - 669, 824) encryptionType : 3 ssid : SB1Guest password : 12345
• Features • 画像の内容を解析し、認識したもののラベルをつける : ⼈、物、場所、活動など • on-device API •
無料 • 400+ labels をサポート • Cloud API • 毎⽉最初の 1000 API call は無料(1000+ からは従量課⾦) • 10,000+ labels をサポート Image labeling : 画像のラベル付け
label : Building confidence : 0.77894384 entityId : /m/0cgh4 label
: Palace confidence : 0.75397676 entityId : /m/05zp8 label : landmark confidence : 0.9432406 entityId : /m/05_5t0l label : town confidence : 0.9333225 entityId : /m/0dx1j
label : Food confidence : 0.9649049 entityId : /m/02wbm label
: Cuisine confidence : 0.91778296 entityId : /m/01ykh label : food confidence : 0.9399401 entityId : /m/02wbm label : cuisine confidence : 0.9263104 entityId : /m/01ykh
val options = FirebaseVisionLabelDetectorOptions .Builder() .setConfidenceThreshold(0.9f) .build()
• Features • 画像から有名なランドマークを認識 • ランドマーク名 • 地理座標 • Knowledge
Graph entity ID • 画像内でのランドマークの領域 • 毎⽉最初の 1000 API call は無料(1000+ からは従量課⾦) Landmark detection : ランドマーク認識
landmark : Amsterdam Centraal Railway Station confidence : 0.86155003 entityId
: /m/0bbw52 locations : 52.378068, 4.899774 boundingBox : Rect(33, 504 - 956, 928) landmark : Amsterdam confidence : 0.5167069 entityId : /m/0k3p locations : 52.373811, 4.890951 boundingBox : Rect(187, 644 - 757, 843)
カスタムモデル推論 • Firebase で TensorFlow Lite のモデルをホスティング • Firebase SDK
がモデルのダウンロードをハンドリング • モデルの更新も可能 • apk にバンドルしたモデルを Firebase SDK 経由で利⽤することも可能 • on-device API として利⽤