JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes 2021 summer

JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う 2021年7月17日 (土) 夏のJavascript祭り Online 　　豊田陽介 ( @youtoy
)

豊田陽介（@youtoy）自己紹介普段は、某通信会社の研究所勤務自宅に各種デバイス等がたくさんビジュアルプログラミング・ IoTなどのコミュニティを単独・共同で主催ガジェット好きその他
IT系イベント主催・登壇なども、子ども向けの活動いろいろ（IT系以外も）プライベートでの活動

2年前にも登壇させていただきましたガジェットとは切っても切れない縁が...w

技術情報誌での連載記事（全4回）月刊I/O で Teachable Machine に関する話

今日のトピック：「機械学習」「外部デバイスとの通信」

今日の登壇に関わる主なキーワード・Teachable Machine ・Lobe ・TensorFlow.js ・ml5.js ・TFJS Task API ・MediaPipe（JavaScript版）
・TensorFlow Lite Model Maker 機械学習関連デバイス通信関連・Web Bluetooth API ・Web Serial API その他・p5.js

説明は一部ざっくりという感じにしつつ

今日のキーワードに関わる情報【キーワード】 user:youtoy で検索 Qiita の記事で

実現できることの例① （2つのトピックに関連）

「JavaScript x 機械学習」に触れ始めた一番強いきかっけ構成的には PCのChrome上で開いた HTML＋JavaScript

全体構成 PC （Chromo・　内蔵マイク） toio＋専用マット BLE HTML + JavaScript ハンドベル・
卓上ベル・声音・声 Web Bluetooth API Teachable Machine （音の機械学習）

展示イベントで子どもから大人まで楽しく Maker Faire 向け：分かりやすさ・体験しやすさ重視

「機械学習」の話から（ディープラーニングの話）

ディープラーニングの流れ（画像分類）学習機械学習モデル推論「これは猫です」未知のデータ学習用データ

JavaScriptで機械学習（いくつかの例）学習推論・自前のデータを利用　・ノンコーディング　・JavaScript ・既存の学習済みモデルを利用・JavaScript 　・直接処理　・API利用
自分で用意 / ありものを利用入力データと機械学習モデルを使った処理 / 入力データを渡す処理をして結果を得る

自前のデータで機械学習モデルを用意（ノンコーディング）

GUI操作のみで機械学習モデル作成！ Googleさんや Microsoftさんが提供・Teachable Machine（Webサイト上）・Lobe（アプリ） https://teachablemachine.withgoogle.com/ https://www.lobe.ai/ 特長・データの取り込みが簡単
・少ないデータでもOK（転移学習）・コードを書かず学習＆推論・機械学習モデルは様々な形式での　出力も（Web用・スマホ用など）画像、音、人の姿勢画像のみ

機械学習モデルをJavaScriptで利用 Teachable Machine のサンプルコードの一部モデルの読み込み推論の処理

Webサイト上で機械学習が行える仕組み裏側の仕組みは TensorFlow.js で実装

JavaScriptで推論を行う際に利用する技術

JavaScriptで扱えるモデルの出力形式・TensorFlow.js 　・プレーンな JavaScript 　・p5.js（ml5.js）・TensorFlow Lite 　・TFJS Task API
TM Lobe TM ＋出力形式ごとのサンプル実装 TM Lobe Teachable Machine Lobe 少し特殊

TFJS Task API？

TFJS Task API での画像分類モバイル向けの TensorFlow Lite のモデルを JavaScript で
使える仕組み（Google I/O 2021 で発表） API を使うための読み込み 1行カスタムモデルの読み込みと推論プログラムはシンプル @0.0.1-alpha.8

実現できることの例② （学習済みモデルの利用）

人を対象にした画像認識（両手の認識の例）ブラウザ上で実行可能

学習済みのモデルを JavaScriptで

自分が利用したことがあるものの例 Googleさんが提供している仕組み・MediaPipe の JavaScript版（TensorFlow.jsベース）　・Face Mesh 　・Face Detection 　・Hands
　・Holistic 　・Pose 　・Selﬁe Segmentation

認識できる対象の例（一部抜粋） Hands Face Mesh

認識できる対象の例（一部抜粋） Holistic Selﬁe Segmentation

実現できることの例③

人を対象にした画像認識（背景分離の例）ブラウザ上で実行可能

「外部デバイスとの通信」

JavaScriptで外部デバイスとの通信ブラウザ上で実行 Node.js 　・Web Serial 　・Web Bluetooth 　・Fetch API 　・axios等を利用
　・WebSocket API 　・MQTT.js等を利用　・Node Serialport 　・noble・bleno 　・Fetch API 　・axios等を利用　・ws等を利用　・MQTT.js等を利用シリアル通信　 BLE 　 HTTPリクエスト　 WebSocket 　 MQTT

デバイス系のAPIについてはこんな話も •Appleがプライバシ上の理由から、NFC、Bluetooth、他14のWeb APIの実装を拒否　https://www.infoq.com/jp/news/2020/07/apple-ﬁngerprinting-privacy/ •Mozilla Speciﬁcation Positions 　https://mozilla.github.io/standards-positions/ 自分に閉じて使うパターンではない場合、特に注意！（ユーザが許可する操作なしに利用できないもの
　ではあるものの...）

実装状況（caniuse.comより）

Bluetoothを扱う

Web Bluetooth API でのデバイス制御・ブラウザから BLE 対応デバイスを制御するもの ⇒ toio・M5Stack・micro:bit 等に対して使った例
手の動きに連動した 6台の toio の同時制御 toio の姿勢角（ロール・ピッチ・　ヨー）のグラフ化 M5Stack Core2 へ文字送信・表示、画面の色変更

Web Bluetooth API でのデバイス制御このような処理をして接続した上で読み書き等の処理（Read、Write、Notify） navigator.bluetooth. requestDevice

Web Bluetooth API でのスキャンデバイス制御で使っていたもの　navigator.bluetooth.requestDevice 別のやり方が必要　navigator.bluetooth.requestLEScan chrome://ﬂags/#enable- experimental-web-platform-
features を Enable に温度 25.1℃ 湿度 56％

実現できることの例④

有線でのデータ取得（シリアル通信の例）ブラウザ上で実行可能

Web Serial API で実装していく細かな部分を読み解いていくのは疲れそうだったけど、仕様を読みながら【引用元】 Web Serial API https://wicg.github.io/serial/

Web Serial API での書き込み EXAMPLE と書かれた複数の項目からプログラムの部分を拾う【引用元】 Web Serial API　　
https://wicg.github.io/serial/ メインの処理は 10行くらいあれば良さそうかも？

Web Serial API での読み取り 1行のまとまりでデバイスから書きだした内容が分割される！？

Web Serial API での読み取り（続き）複数の入力をまとめてから改行部分で分割する処理の話がある Node.js で Node Serialport を使う場合だと、
Readline Parser とかでうまく処理してくれる

グラフ描画に使ったライブラリ chartjs-plugin-streaming 動画で使っていたのはこれの旧バージョン

ここからは時間が残っていた場合に

TensorFlow Lite Model Maker

TensorFlow Lite Model Maker 機械学習モデルの作成を簡素化してくれる（言語は Python）

TensorFlow Lite Model Maker プログラムは短い Google Colab で開いて、ページ上でポチポチ操作して実行

終わり！

JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes...

JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes 2021 summer

More Decks by you（@youtoy）

Other Decks in Technology

Featured

Transcript