Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes...
Search
you(@youtoy)
PRO
July 17, 2021
Technology
0
300
JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes 2021 summer
you(@youtoy)
PRO
July 17, 2021
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
"かわいい" がテーマのハッカソンでWebの技術を使って魔法の世界を作った話など / HTML5 10th Anniversary
you
PRO
0
64
ブラウザで AI・機械学習が扱える TensorFlow.js が使われているライブラリなどの話 / #さくらのAI Meetup vol.4「ブラウザ」
you
PRO
0
130
Blynk と Raspberry Pi Pico W で IoT 〜 MQTT・HTTPリクエストの組み合わせも 〜 / IoTLT vol.114
you
PRO
0
270
AIを活用したWebアプリのプロトタイプを作ってコンテストや展示に出してみた話 / 大阪工業大学 ネットワークデザイン学科 LT大会 2024v2
you
PRO
0
65
Babylon.jsと色々なものを組み合わせる:ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3
you
PRO
0
500
WebHID API で Joy-Con・DUALSHOCK 4 のセンサーをブラウザから利用する / IoTLT vol.109
you
PRO
0
240
UIFlow 2.0 で MQTT をやってみた! / IoTLT vol.108
you
PRO
0
2.6k
UIFlow 2.0 と ATOMS3 の組み合わせで LINE通知を試す / ビジュアルプログラミングIoTLT vol.16
you
PRO
0
460
技術コミュニティの中での生成AI(自身の観測範囲での事例について) / 23 Xmas Talk / 20231209
you
PRO
0
1.5k
Other Decks in Technology
See All in Technology
OCI Security サービス 概要
oracle4engineer
PRO
0
6.5k
Why App Signing Matters for Your Android Apps - Android Bangkok Conference 2024
akexorcist
0
130
Making your applications cross-environment - OSCG 2024 NA
salaboy
0
210
ノーコードデータ分析ツールで体験する時系列データ分析超入門
negi111111
0
430
CysharpのOSS群から見るModern C#の現在地
neuecc
2
3.7k
OS 標準のデザインシステムを超えて - より柔軟な Flutter テーマ管理 | FlutterKaigi 2024
ronnnnn
1
310
個人でもIAM Identity Centerを使おう!(アクセス管理編)
ryder472
4
250
CDCL による厳密解法を採用した MILP ソルバー
imai448
3
210
Terraform Stacks入門 #HashiTalks
msato
0
360
Lambda10周年!Lambdaは何をもたらしたか
smt7174
2
130
ExaDB-D dbaascli で出来ること
oracle4engineer
PRO
0
3.9k
A Tour of Anti-patterns for Functional Programming
guvalif
0
120
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
43
13k
Typedesign – Prime Four
hannesfritz
40
2.4k
Become a Pro
speakerdeck
PRO
25
5k
Designing Experiences People Love
moore
138
23k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
[RailsConf 2023] Rails as a piece of cake
palkan
52
4.9k
RailsConf 2023
tenderlove
29
900
GitHub's CSS Performance
jonrohan
1030
460k
Practical Orchestrator
shlominoach
186
10k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Code Reviewing Like a Champion
maltzj
520
39k
jQuery: Nuts, Bolts and Bling
dougneiner
61
7.5k
Transcript
JavaScriptで外部デバイスとの通信や 機械学習による画像・音の認識を扱う 2021年7月17日 (土) 夏のJavascript祭り Online 豊田 陽介 ( @youtoy
)
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 自宅に各種デバイス等 がたくさん ビジュアルプログラミング・ IoTなどのコミュニティを 単独・共同で主催 ガジェット好き その他
IT系イベント主催・登壇なども、 子ども向けの活動いろいろ(IT系以外も) プライベートでの活動
2年前にも登壇させていただきました ガジェットとは切っても切れない縁が...w
技術情報誌での連載記事(全4回) 月刊I/O で Teachable Machine に関する話
今日のトピック: 「機械学習」 「外部デバイスとの通信」
今日の登壇に関わる主なキーワード ・Teachable Machine ・Lobe ・TensorFlow.js ・ml5.js ・TFJS Task API ・MediaPipe(JavaScript版)
・TensorFlow Lite Model Maker 機械学習関連 デバイス通信関連 ・Web Bluetooth API ・Web Serial API その他 ・p5.js
説明は一部ざっくり という感じにしつつ
今日のキーワードに関わる情報 【キーワード】 user:youtoy で検索 Qiita の記事で
実現できることの例① (2つのトピックに関連)
「JavaScript x 機械学習」に触れ始めた一番強いきかっけ 構成的には PCのChrome上で開いた HTML+JavaScript
全体構成 PC (Chromo・ 内蔵マイク) toio+専用マット BLE HTML + JavaScript ハンドベル・
卓上ベル・声 音・声 Web Bluetooth API Teachable Machine (音の機械学習)
展示イベントで子どもから大人まで楽しく Maker Faire 向け:分かりやすさ・体験しやすさ重視
「機械学習」の話から (ディープラーニングの話)
ディープラーニングの流れ(画像分類) 学習 機械学習 モデル 推論 「これは 猫 です」 未知のデータ 学習用データ
JavaScriptで機械学習(いくつかの例) 学習 推論 ・自前のデータを利用 ・ノンコーディング ・JavaScript ・既存の学習済みモデルを利用 ・JavaScript ・直接処理 ・API利用
自分で用意 / ありものを利用 入力データと機械学習モデル を使った処理 / 入力データを 渡す処理をして結果を得る
自前のデータで 機械学習モデルを用意 (ノンコーディング)
GUI操作のみで機械学習モデル作成! Googleさんや Microsoftさんが提供 ・Teachable Machine(Webサイト上) ・Lobe(アプリ) https://teachablemachine.withgoogle.com/ https://www.lobe.ai/ 特長 ・データの取り込みが簡単
・少ないデータでもOK(転移学習) ・コードを書かず学習&推論 ・機械学習モデルは様々な形式での 出力も(Web用・スマホ用など) 画像、音、人の姿勢 画像のみ
機械学習モデルをJavaScriptで利用 Teachable Machine のサンプルコードの一部 モデルの読み込み 推論の処理
Webサイト上で機械学習が行える仕組み 裏側の仕組みは TensorFlow.js で 実装
JavaScriptで 推論を行う際に 利用する技術
JavaScriptで扱えるモデルの出力形式 ・TensorFlow.js ・プレーンな JavaScript ・p5.js(ml5.js) ・TensorFlow Lite ・TFJS Task API
TM Lobe TM + 出力形式ごとのサンプル実装 TM Lobe Teachable Machine Lobe 少し特殊
TFJS Task API?
TFJS Task API での画像分類 モバイル向けの TensorFlow Lite のモデルを JavaScript で
使える仕組み(Google I/O 2021 で発表) API を使うための読み込み 1行 カスタムモデルの読み込みと推論 プログラムはシンプル @0.0.1-alpha.8
実現できることの例② (学習済みモデルの利用)
人を対象にした画像認識(両手の認識の例) ブラウザ上で実行可能
学習済みのモデルを JavaScriptで
自分が利用したことがあるものの例 Googleさんが提供している仕組み ・MediaPipe の JavaScript版(TensorFlow.jsベース) ・Face Mesh ・Face Detection ・Hands
・Holistic ・Pose ・Selfie Segmentation
認識できる対象の例(一部抜粋) Hands Face Mesh
認識できる対象の例(一部抜粋) Holistic Selfie Segmentation
実現できることの例③
人を対象にした画像認識(背景分離の例) ブラウザ上で実行可能
「外部デバイスとの通信」
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
デバイス系のAPIについてはこんな話も •Appleがプライバシ上の理由から、NFC、Bluetooth、他14のWeb APIの実装を拒否 https://www.infoq.com/jp/news/2020/07/apple-fingerprinting-privacy/ •Mozilla Specification Positions https://mozilla.github.io/standards-positions/ 自分に閉じて使うパターンではない場合、特に注意! (ユーザが許可する操作なしに利用できないもの
ではあるものの...)
実装状況(caniuse.comより)
Bluetoothを扱う
Web Bluetooth API でのデバイス制御 ・ブラウザから BLE 対応デバイスを制御するもの ⇒ toio・M5Stack・micro:bit 等に対して使った例
手の動きに連動した 6台の toio の同時制御 toio の姿勢角 (ロール・ピッチ・ ヨー)のグラフ化 M5Stack Core2 へ 文字送信・表示、 画面の色変更
Web Bluetooth API でのデバイス制御 このような処理をして接続 した上で読み書き等の処理 (Read、Write、Notify) navigator.bluetooth. requestDevice
Web Bluetooth API でのスキャン デバイス制御で使っていたもの navigator.bluetooth.requestDevice 別のやり方が必要 navigator.bluetooth.requestLEScan chrome://flags/#enable- experimental-web-platform-
features を Enable に 温度 25.1℃ 湿度 56%
実現できることの例④
有線でのデータ取得(シリアル通信の例) ブラウザ上で実行可能
Web Serial API で実装していく 細かな部分を読み解いていくのは疲れそうだったけど、仕様を読みながら 【引用元】 Web Serial API https://wicg.github.io/serial/
Web Serial API での書き込み EXAMPLE と書かれた複数の項目からプログラムの部分を拾う 【引用元】 Web Serial API
https://wicg.github.io/serial/ メインの処理は 10行くらい あれば良さそうかも?
Web Serial API での読み取り 1行のまとまりでデバイスから書きだした内容が分割される!?
Web Serial API での読み取り(続き) 複数の入力をまとめてから改行部分で分割する処理の話がある Node.js で Node Serialport を使う場合だと、
Readline Parser とかでうまく処理してくれる
グラフ描画に使ったライブラリ chartjs-plugin-streaming 動画で使っていたのは これの旧バージョン
ここからは時間が 残っていた場合に
TensorFlow Lite Model Maker
TensorFlow Lite Model Maker 機械学習モデルの作成を 簡素化してくれる (言語は Python)
TensorFlow Lite Model Maker プログラムは短い Google Colab で開いて、 ページ上でポチポチ操作して実行
終わり!