MLKit DevFest18 ATL

MLKit AI Commoditized Bolot Kerimbaev

Supervised Unsupervised Classiﬁcation Regression Clustering Dimensionality reduction Reinforcement Regularization Bayesian
Neural networks Deep learning Support vector machines Decision tree k-Nearest neighbors k-Means Hidden Markov models

Machine Learning • Supervised • Classiﬁcation • Regression • Unsupervised
• Clustering • Dimensionality reduction • Reinforcement • Q-Learning

Why ML?

Why ML? • Task match • State of the art
techniques • New products • Automation • Better performance • Move into new business • Competitive advantage • Cost reduction • Consumer demand • Je ne sais quoi

Applications • Speech recognition • Face recognition • Machine translation
• Image classiﬁcation • News article generation • Employee access control • Protecting animals • Predicting ER wait times • Identifying heart failure • Predicting strokes and seizures • Predicting hospital readmissions • Recommendation systems

Software • Caffe - Berkeley • CNTK - Microsoft •
DL4J - Skymind • DSSTNE - Amazon • TensorFlow - Google • Theano - Université de Montréal • Torch - Google DeepMind, Facebook AI, etc. • PyTorch • Keras • Numpy, SciKit • Pandas • Matlab • Octave • R

TensorFlow

MLKit features • Face detection • Image labeling • Landmark
recognition • Barcode scanning • Text recognition

Why MLKit? • Simple API • Pre-packaged models • Expandability
• Cloud-backed • Model updates

Firebase

Dependencies // ML Kit dependencies implementation 'com.google.firebase:firebase-core:16.0.3' implementation 'com.google.firebase:firebase-ml-common:16.1.2' implementation
'com.google.firebase:firebase-ml-vision:17.0.0' implementation 'com.google.firebase:firebase-ml-vision-image-label-model:15.0.0' implementation 'com.google.firebase:firebase-ml-model-interpreter:16.2.0'

Artiﬁcial Neural Networks

Fashion MNIST

Image labeling https://xkcd.com/1425/

Image Labeling FirebaseVision.getInstance().visionLabelDetector .detectInImage(image) .addOnSuccessListener { labels -> val output
= labels.map { "$it.label: $it.confidence" } Log.d(TAG, "Found labels:\n$output") }

Convolutional Neural Networks

Case Study: Puller Detection

Inception

Classiﬁcation, Detection, Segmentation

Neural Style Transfer

Face detection

Face detection val options = FirebaseVisionFaceDetectorOptions.Builder() .setClassificationType(FirebaseVisionFaceDetectorOptions.ALL_CLASSIFICATIONS) .setLandmarkType(FirebaseVisionFaceDetectorOptions.ALL_LANDMARKS) .setTrackingEnabled(true) .build()
detector = FirebaseVision.getInstance().getVisionFaceDetector(options) detector.detectInImage(image) .addOnSuccessListener { results -> for (i in faces.indices) { val face = faces[i] val faceGraphic = FaceGraphic(graphicOverlay) graphicOverlay.add(faceGraphic) faceGraphic.updateFace(face, metadata.cameraFacing) } } .addOnFailureListener { e -> }

Recurrent Neural Networks

Case Study: Dropbox OCR

Text recognition

Text recognition detector = FirebaseVision.getInstance().onDeviceTextRecognizer detector.processImage(image) .addOnSuccessListener { results ->
val blocks = results.textBlocks for (i in blocks.indices) { val lines = blocks[i].lines for (j in lines.indices) { val elements = lines[j].elements for (k in elements.indices) { val textGraphic = TextGraphic(graphicOverlay, elements[k]) graphicOverlay.add(textGraphic) } } } .addOnFailureListener { e -> }

Text recognition detector = FirebaseVision.getInstance().cloudTextRecognizer detector.processImage(image) .addOnSuccessListener { results ->
val blocks = results.textBlocks for (i in blocks.indices) { val lines = blocks[i].lines for (j in lines.indices) { val elements = lines[j].elements for (k in elements.indices) { val textGraphic = TextGraphic(graphicOverlay, elements[k]) graphicOverlay.add(textGraphic) } } } .addOnFailureListener { e -> }

Case study: receipt scanning • Image labeling • Rectangle detection
• Text recognition

Case Study: Google Street View

RNN: Scrubs Script

Image captioning

Capsule Networks

Generative Adversarial Networks

Education • https://www.deeplearning.ai • https://www.deeplearningbook.org • https://ai.google/education • https://developers.google.com/machine-learning/crash-course/ •
http://cs231n.stanford.edu CNNs for Visual Recognition

Questions? twitter.com/bolot caffeine.tv

MLKit DevFest18 ATL

MLKit DevFest18 ATL

More Decks by bolot

Other Decks in Programming

Featured

Transcript