Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes...
Search
you(@youtoy)
PRO
July 17, 2021
Technology
0
340
JavaScriptで外部デバイスとの通信や機械学習による画像・音の認識を扱う / jsfes 2021 summer
you(@youtoy)
PRO
July 17, 2021
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
57
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
170
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
100
ChatGPT からモックサーバー宛(Beeceptor宛)の HTTPリクエストを試す / IoTLT 202504
you
PRO
0
97
デモをまじえつつの生成AIの話題 / 横須賀プログラミング“夢”アカデミー発表会(2025年3月)
you
PRO
0
49
もくはりでのモノ作りと自身のモノ作り活動 / もくはり文化祭2024 オープン記念イベント
you
PRO
0
55
"かわいい" がテーマのハッカソンでWebの技術を使って魔法の世界を作った話など / HTML5 10th Anniversary
you
PRO
0
110
ブラウザで AI・機械学習が扱える TensorFlow.js が使われているライブラリなどの話 / #さくらのAI Meetup vol.4「ブラウザ」
you
PRO
0
230
Blynk と Raspberry Pi Pico W で IoT 〜 MQTT・HTTPリクエストの組み合わせも 〜 / IoTLT vol.114
you
PRO
0
2.5k
Other Decks in Technology
See All in Technology
AIにどこまで任せる?実務で使える(かもしれない)AIエージェント設計の考え方
har1101
3
1.2k
Whats_new_in_Podman_and_CRI-O_2025-06
orimanabu
3
180
TerraformをSaaSで使うとAzureの運用がこんなに楽ちん!HCP Terraformって何?
mnakabayashi
0
200
ObsidianをMCP連携させてみる
ttnyt8701
2
130
堅牢な認証基盤の実現 TypeScriptで代数的データ型を活用する
kakehashi
PRO
2
240
生成AIをテストプロセスに活用し"よう"としている話 #jasstnano
makky_tyuyan
0
240
OCI Oracle Database Services新機能アップデート(2025/03-2025/05)
oracle4engineer
PRO
1
190
型システムを知りたい人のための型検査器作成入門
mame
15
3.9k
新規プロダクト開発、AIでどう変わった? #デザインエンジニアMeetup
bengo4com
0
490
Azure AI Foundryでマルチエージェントワークフロー
seosoft
0
120
Uniadex__公開版_20250617-AIxIoTビジネス共創ラボ_ツナガルチカラ_.pdf
iotcomjpadmin
0
120
ハノーバーメッセ2025座談会.pdf
iotcomjpadmin
0
120
Featured
See All Featured
Optimising Largest Contentful Paint
csswizardry
37
3.3k
RailsConf 2023
tenderlove
30
1.1k
The Cult of Friendly URLs
andyhume
79
6.4k
Designing Experiences People Love
moore
142
24k
YesSQL, Process and Tooling at Scale
rocio
172
14k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
Testing 201, or: Great Expectations
jmmastey
42
7.5k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
910
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
16
930
How to Think Like a Performance Engineer
csswizardry
24
1.7k
Transcript
JavaScriptで外部デバイスとの通信や 機械学習による画像・音の認識を扱う 2021年7月17日 (土) 夏のJavascript祭り Online 豊田 陽介 ( @youtoy
)
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 自宅に各種デバイス等 がたくさん ビジュアルプログラミング・ IoTなどのコミュニティを 単独・共同で主催 ガジェット好き その他
IT系イベント主催・登壇なども、 子ども向けの活動いろいろ(IT系以外も) プライベートでの活動
2年前にも登壇させていただきました ガジェットとは切っても切れない縁が...w
技術情報誌での連載記事(全4回) 月刊I/O で Teachable Machine に関する話
今日のトピック: 「機械学習」 「外部デバイスとの通信」
今日の登壇に関わる主なキーワード ・Teachable Machine ・Lobe ・TensorFlow.js ・ml5.js ・TFJS Task API ・MediaPipe(JavaScript版)
・TensorFlow Lite Model Maker 機械学習関連 デバイス通信関連 ・Web Bluetooth API ・Web Serial API その他 ・p5.js
説明は一部ざっくり という感じにしつつ
今日のキーワードに関わる情報 【キーワード】 user:youtoy で検索 Qiita の記事で
実現できることの例① (2つのトピックに関連)
「JavaScript x 機械学習」に触れ始めた一番強いきかっけ 構成的には PCのChrome上で開いた HTML+JavaScript
全体構成 PC (Chromo・ 内蔵マイク) toio+専用マット BLE HTML + JavaScript ハンドベル・
卓上ベル・声 音・声 Web Bluetooth API Teachable Machine (音の機械学習)
展示イベントで子どもから大人まで楽しく Maker Faire 向け:分かりやすさ・体験しやすさ重視
「機械学習」の話から (ディープラーニングの話)
ディープラーニングの流れ(画像分類) 学習 機械学習 モデル 推論 「これは 猫 です」 未知のデータ 学習用データ
JavaScriptで機械学習(いくつかの例) 学習 推論 ・自前のデータを利用 ・ノンコーディング ・JavaScript ・既存の学習済みモデルを利用 ・JavaScript ・直接処理 ・API利用
自分で用意 / ありものを利用 入力データと機械学習モデル を使った処理 / 入力データを 渡す処理をして結果を得る
自前のデータで 機械学習モデルを用意 (ノンコーディング)
GUI操作のみで機械学習モデル作成! Googleさんや Microsoftさんが提供 ・Teachable Machine(Webサイト上) ・Lobe(アプリ) https://teachablemachine.withgoogle.com/ https://www.lobe.ai/ 特長 ・データの取り込みが簡単
・少ないデータでもOK(転移学習) ・コードを書かず学習&推論 ・機械学習モデルは様々な形式での 出力も(Web用・スマホ用など) 画像、音、人の姿勢 画像のみ
機械学習モデルをJavaScriptで利用 Teachable Machine のサンプルコードの一部 モデルの読み込み 推論の処理
Webサイト上で機械学習が行える仕組み 裏側の仕組みは TensorFlow.js で 実装
JavaScriptで 推論を行う際に 利用する技術
JavaScriptで扱えるモデルの出力形式 ・TensorFlow.js ・プレーンな JavaScript ・p5.js(ml5.js) ・TensorFlow Lite ・TFJS Task API
TM Lobe TM + 出力形式ごとのサンプル実装 TM Lobe Teachable Machine Lobe 少し特殊
TFJS Task API?
TFJS Task API での画像分類 モバイル向けの TensorFlow Lite のモデルを JavaScript で
使える仕組み(Google I/O 2021 で発表) API を使うための読み込み 1行 カスタムモデルの読み込みと推論 プログラムはシンプル @0.0.1-alpha.8
実現できることの例② (学習済みモデルの利用)
人を対象にした画像認識(両手の認識の例) ブラウザ上で実行可能
学習済みのモデルを JavaScriptで
自分が利用したことがあるものの例 Googleさんが提供している仕組み ・MediaPipe の JavaScript版(TensorFlow.jsベース) ・Face Mesh ・Face Detection ・Hands
・Holistic ・Pose ・Selfie Segmentation
認識できる対象の例(一部抜粋) Hands Face Mesh
認識できる対象の例(一部抜粋) Holistic Selfie Segmentation
実現できることの例③
人を対象にした画像認識(背景分離の例) ブラウザ上で実行可能
「外部デバイスとの通信」
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
デバイス系のAPIについてはこんな話も •Appleがプライバシ上の理由から、NFC、Bluetooth、他14のWeb APIの実装を拒否 https://www.infoq.com/jp/news/2020/07/apple-fingerprinting-privacy/ •Mozilla Specification Positions https://mozilla.github.io/standards-positions/ 自分に閉じて使うパターンではない場合、特に注意! (ユーザが許可する操作なしに利用できないもの
ではあるものの...)
実装状況(caniuse.comより)
Bluetoothを扱う
Web Bluetooth API でのデバイス制御 ・ブラウザから BLE 対応デバイスを制御するもの ⇒ toio・M5Stack・micro:bit 等に対して使った例
手の動きに連動した 6台の toio の同時制御 toio の姿勢角 (ロール・ピッチ・ ヨー)のグラフ化 M5Stack Core2 へ 文字送信・表示、 画面の色変更
Web Bluetooth API でのデバイス制御 このような処理をして接続 した上で読み書き等の処理 (Read、Write、Notify) navigator.bluetooth. requestDevice
Web Bluetooth API でのスキャン デバイス制御で使っていたもの navigator.bluetooth.requestDevice 別のやり方が必要 navigator.bluetooth.requestLEScan chrome://flags/#enable- experimental-web-platform-
features を Enable に 温度 25.1℃ 湿度 56%
実現できることの例④
有線でのデータ取得(シリアル通信の例) ブラウザ上で実行可能
Web Serial API で実装していく 細かな部分を読み解いていくのは疲れそうだったけど、仕様を読みながら 【引用元】 Web Serial API https://wicg.github.io/serial/
Web Serial API での書き込み EXAMPLE と書かれた複数の項目からプログラムの部分を拾う 【引用元】 Web Serial API
https://wicg.github.io/serial/ メインの処理は 10行くらい あれば良さそうかも?
Web Serial API での読み取り 1行のまとまりでデバイスから書きだした内容が分割される!?
Web Serial API での読み取り(続き) 複数の入力をまとめてから改行部分で分割する処理の話がある Node.js で Node Serialport を使う場合だと、
Readline Parser とかでうまく処理してくれる
グラフ描画に使ったライブラリ chartjs-plugin-streaming 動画で使っていたのは これの旧バージョン
ここからは時間が 残っていた場合に
TensorFlow Lite Model Maker
TensorFlow Lite Model Maker 機械学習モデルの作成を 簡素化してくれる (言語は Python)
TensorFlow Lite Model Maker プログラムは短い Google Colab で開いて、 ページ上でポチポチ操作して実行
終わり!