Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes...
Search
you(@youtoy)
PRO
July 17, 2021
Technology
0
340
JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes 2021 summer
you(@youtoy)
PRO
July 17, 2021
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
AIエージェント開発用SDKとローカルLLMをLINE Botと組み合わせてみた / LINEを使ったLT大会 #14
you
PRO
0
120
ブラウザで CircuitPython の開発:公式の「CircuitPython Code Editor」を試した / 【屋形船開催】IoT縛りの勉強会! IoTLT vol.126 @東京湾
you
PRO
0
110
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
2.6k
Webの技術とガジェットで那須の子ども達にワクワクを! / IoTLT_20250720
you
PRO
0
140
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
2.5k
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
170
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
310
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
230
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
130
Other Decks in Technology
See All in Technology
【実演版】カンファレンス登壇者・スタッフにこそ知ってほしいマイクの使い方 / 大吉祥寺.pm 2025
arthur1
1
850
RSCの時代にReactとフレームワークの境界を探る
uhyo
10
3.4k
【NoMapsTECH 2025】AI Edge Computing Workshop
akit37
0
150
2025年夏 コーディングエージェントを統べる者
nwiizo
0
170
オブザーバビリティが広げる AIOps の世界 / The World of AIOps Expanded by Observability
aoto
PRO
0
380
Language Update: Java
skrb
2
300
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
220
未経験者・初心者に贈る!40分でわかるAndroidアプリ開発の今と大事なポイント
operando
5
620
なぜスクラムはこうなったのか?歴史が教えてくれたこと/Shall we explore the roots of Scrum
sanogemaru
5
1.6k
Automating Web Accessibility Testing with AI Agents
maminami373
0
1.3k
ZOZOマッチのアーキテクチャと技術構成
zozotech
PRO
4
1.5k
S3アクセス制御の設計ポイント
tommy0124
3
200
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.1k
GraphQLとの向き合い方2022年版
quramy
49
14k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
8
520
Statistics for Hackers
jakevdp
799
220k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
840
RailsConf 2023
tenderlove
30
1.2k
Being A Developer After 40
akosma
90
590k
A Tale of Four Properties
chriscoyier
160
23k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
139
34k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Transcript
JavaScriptで外部デバイスとの通信や 機械学習による画像・音の認識を扱う 2021年7月17日 (土) 夏のJavascript祭り Online 豊田 陽介 ( @youtoy
)
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 自宅に各種デバイス等 がたくさん ビジュアルプログラミング・ IoTなどのコミュニティを 単独・共同で主催 ガジェット好き その他
IT系イベント主催・登壇なども、 子ども向けの活動いろいろ(IT系以外も) プライベートでの活動
2年前にも登壇させていただきました ガジェットとは切っても切れない縁が...w
技術情報誌での連載記事(全4回) 月刊I/O で Teachable Machine に関する話
今日のトピック: 「機械学習」 「外部デバイスとの通信」
今日の登壇に関わる主なキーワード ・Teachable Machine ・Lobe ・TensorFlow.js ・ml5.js ・TFJS Task API ・MediaPipe(JavaScript版)
・TensorFlow Lite Model Maker 機械学習関連 デバイス通信関連 ・Web Bluetooth API ・Web Serial API その他 ・p5.js
説明は一部ざっくり という感じにしつつ
今日のキーワードに関わる情報 【キーワード】 user:youtoy で検索 Qiita の記事で
実現できることの例① (2つのトピックに関連)
「JavaScript x 機械学習」に触れ始めた一番強いきかっけ 構成的には PCのChrome上で開いた HTML+JavaScript
全体構成 PC (Chromo・ 内蔵マイク) toio+専用マット BLE HTML + JavaScript ハンドベル・
卓上ベル・声 音・声 Web Bluetooth API Teachable Machine (音の機械学習)
展示イベントで子どもから大人まで楽しく Maker Faire 向け:分かりやすさ・体験しやすさ重視
「機械学習」の話から (ディープラーニングの話)
ディープラーニングの流れ(画像分類) 学習 機械学習 モデル 推論 「これは 猫 です」 未知のデータ 学習用データ
JavaScriptで機械学習(いくつかの例) 学習 推論 ・自前のデータを利用 ・ノンコーディング ・JavaScript ・既存の学習済みモデルを利用 ・JavaScript ・直接処理 ・API利用
自分で用意 / ありものを利用 入力データと機械学習モデル を使った処理 / 入力データを 渡す処理をして結果を得る
自前のデータで 機械学習モデルを用意 (ノンコーディング)
GUI操作のみで機械学習モデル作成! Googleさんや Microsoftさんが提供 ・Teachable Machine(Webサイト上) ・Lobe(アプリ) https://teachablemachine.withgoogle.com/ https://www.lobe.ai/ 特長 ・データの取り込みが簡単
・少ないデータでもOK(転移学習) ・コードを書かず学習&推論 ・機械学習モデルは様々な形式での 出力も(Web用・スマホ用など) 画像、音、人の姿勢 画像のみ
機械学習モデルをJavaScriptで利用 Teachable Machine のサンプルコードの一部 モデルの読み込み 推論の処理
Webサイト上で機械学習が行える仕組み 裏側の仕組みは TensorFlow.js で 実装
JavaScriptで 推論を行う際に 利用する技術
JavaScriptで扱えるモデルの出力形式 ・TensorFlow.js ・プレーンな JavaScript ・p5.js(ml5.js) ・TensorFlow Lite ・TFJS Task API
TM Lobe TM + 出力形式ごとのサンプル実装 TM Lobe Teachable Machine Lobe 少し特殊
TFJS Task API?
TFJS Task API での画像分類 モバイル向けの TensorFlow Lite のモデルを JavaScript で
使える仕組み(Google I/O 2021 で発表) API を使うための読み込み 1行 カスタムモデルの読み込みと推論 プログラムはシンプル @0.0.1-alpha.8
実現できることの例② (学習済みモデルの利用)
人を対象にした画像認識(両手の認識の例) ブラウザ上で実行可能
学習済みのモデルを JavaScriptで
自分が利用したことがあるものの例 Googleさんが提供している仕組み ・MediaPipe の JavaScript版(TensorFlow.jsベース) ・Face Mesh ・Face Detection ・Hands
・Holistic ・Pose ・Selfie Segmentation
認識できる対象の例(一部抜粋) Hands Face Mesh
認識できる対象の例(一部抜粋) Holistic Selfie Segmentation
実現できることの例③
人を対象にした画像認識(背景分離の例) ブラウザ上で実行可能
「外部デバイスとの通信」
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
デバイス系のAPIについてはこんな話も •Appleがプライバシ上の理由から、NFC、Bluetooth、他14のWeb APIの実装を拒否 https://www.infoq.com/jp/news/2020/07/apple-fingerprinting-privacy/ •Mozilla Specification Positions https://mozilla.github.io/standards-positions/ 自分に閉じて使うパターンではない場合、特に注意! (ユーザが許可する操作なしに利用できないもの
ではあるものの...)
実装状況(caniuse.comより)
Bluetoothを扱う
Web Bluetooth API でのデバイス制御 ・ブラウザから BLE 対応デバイスを制御するもの ⇒ toio・M5Stack・micro:bit 等に対して使った例
手の動きに連動した 6台の toio の同時制御 toio の姿勢角 (ロール・ピッチ・ ヨー)のグラフ化 M5Stack Core2 へ 文字送信・表示、 画面の色変更
Web Bluetooth API でのデバイス制御 このような処理をして接続 した上で読み書き等の処理 (Read、Write、Notify) navigator.bluetooth. requestDevice
Web Bluetooth API でのスキャン デバイス制御で使っていたもの navigator.bluetooth.requestDevice 別のやり方が必要 navigator.bluetooth.requestLEScan chrome://flags/#enable- experimental-web-platform-
features を Enable に 温度 25.1℃ 湿度 56%
実現できることの例④
有線でのデータ取得(シリアル通信の例) ブラウザ上で実行可能
Web Serial API で実装していく 細かな部分を読み解いていくのは疲れそうだったけど、仕様を読みながら 【引用元】 Web Serial API https://wicg.github.io/serial/
Web Serial API での書き込み EXAMPLE と書かれた複数の項目からプログラムの部分を拾う 【引用元】 Web Serial API
https://wicg.github.io/serial/ メインの処理は 10行くらい あれば良さそうかも?
Web Serial API での読み取り 1行のまとまりでデバイスから書きだした内容が分割される!?
Web Serial API での読み取り(続き) 複数の入力をまとめてから改行部分で分割する処理の話がある Node.js で Node Serialport を使う場合だと、
Readline Parser とかでうまく処理してくれる
グラフ描画に使ったライブラリ chartjs-plugin-streaming 動画で使っていたのは これの旧バージョン
ここからは時間が 残っていた場合に
TensorFlow Lite Model Maker
TensorFlow Lite Model Maker 機械学習モデルの作成を 簡素化してくれる (言語は Python)
TensorFlow Lite Model Maker プログラムは短い Google Colab で開いて、 ページ上でポチポチ操作して実行
終わり!