Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ブラウザ上でリアルタイム画像認識と認識結果に連動した描画(MediaPipeとp5.js) /...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
you(@youtoy)
PRO
September 03, 2021
Technology
940
0
Share
ブラウザ上でリアルタイム画像認識と認識結果に連動した描画(MediaPipeとp5.js) / xTech ゆるっとLT (202109)
you(@youtoy)
PRO
September 03, 2021
More Decks by you(@youtoy)
See All by you(@youtoy)
最近の技術系の話題で気になったもの色々(IoT系以外も) / IoTLT 花見予定会(たぶんBBQ) @都立潮風公園バーベキュー広場
you
PRO
1
350
Babylon.js を使って試した色々な内容 / Various things I tried using Babylon.js / Babylon.js 勉強会 vol.5
you
PRO
0
430
イベントで大活躍する電子ペーパー名札を作る(その2) 〜 M5PaperとM5PaperS3 〜 / IoTLT @ JLCPCB オープンハードカンファレンス
you
PRO
0
280
Deno・Bunの標準機能やElysiaJSを使ったWebSocketサーバー実装 / ラーメン屋を貸し切ってLT会! IoTLT 2026新年会
you
PRO
0
350
M5Stack Chain DualKey を UIFlow 2.0 + USB接続で試す / ビジュアルプログラミングIoTLT vol.22
you
PRO
2
220
ローカルLLMをJavaScriptで(少しAIエージェントSDKなどの話も) / 冬のJavaScript祭り @Pleasanter Lounge
you
PRO
0
970
Webの技術で「特殊なゲーム用コントローラーや他デバイスなど」とブラウザを連携させる / HTML5 11th Anniversary
you
PRO
0
110
ブラウザのAPIで Nintendo Switch用の特殊なゲーム用コントローラーを体験型コンテンツに / IoTLT @ストラタシス・ジャパン
you
PRO
0
230
ローカルLLMとLINE Botの組み合わせ その2(EVO-X2でgpt-oss-120bを利用) / LINE DC Generative AI Meetup #7
you
PRO
1
1k
Other Decks in Technology
See All in Technology
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.4k
雑談は、センサーだった
bitkey
PRO
2
230
2026-05-14 要件定義からソース管理まで!IBM Bob基礎ハンズオン
yutanonaka
0
140
React 19×Rustツール 進化の「ズレ」を設計で埋める
remrem0090
1
110
「QA=テスト」「シフトレフト=スクラムイベントの参加者の一員」の呪縛を解く。アジャイルな開発を止めないために、10Xで挑んだ「右側のしわ寄せ」解消記 #scrumniigata
nihonbuson
PRO
5
1.3k
マンション備え付けのネットワークとLTE回線を組み合わせた ネットワークの安定化の考案
harutiro
1
130
ServiceによるKubernetes通信制御ーClusterIPを例に
miku01
1
160
AI飲み会幹事エージェントを作っただけなのに
ykimi
0
180
自動テストだけで リリース判断できるチームへ - 鍵はテストの量ではなくリリース判断基準の再設計にあった / Redesigning Release Criteria for Lightweight Releases
ewa
7
3.7k
アプリブロック機能のつくりかたと、AIとHTMLの不合理な相性の良さについて
kumamotone
1
250
生成AIはソフトウェア開発の革命か、ソフトウェア工学の宿題再提出なのか -ソフトウェア品質特性の追加提案-
kyonmm
PRO
2
900
全社統制を維持しながら現場負担をどう減らすか〜プラットフォームチームとセキュリティチームで進めたSecurity Hub活用によるAWS統制の見直し〜/secjaws-security-hub-custom-insights
mhrtech
1
440
Featured
See All Featured
30 Presentation Tips
portentint
PRO
1
290
ラッコキーワード サービス紹介資料
rakko
1
3.3M
BBQ
matthewcrist
89
10k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
What's in a price? How to price your products and services
michaelherold
247
13k
Unsuck your backbone
ammeep
672
58k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
550
My Coaching Mixtape
mlcsv
0
120
Darren the Foodie - Storyboard
khoart
PRO
3
3.3k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
920
Why Our Code Smells
bkeepers
PRO
340
58k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Transcript
ブラウザ上でリアルタイム画像認識と 認識結果に連動した描画(MediaPipeとp5.js) 2021年9月3日 (金) xTech ゆるっとLT: Fukuoka.php and AR_Fukuoka @オンライン
豊田 陽介 ( @youtoy )
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 自宅にたくさん ビジュアルプログラミング、 IoT関連、その他の複数の コミュニティを主催 ガジェット好き その他 IT系イベント主催、登壇や運営なども
子ども向けの活動いろいろ(IT系以外も) プライベートでの活動
技術雑誌で連載中(機械学習関連) ・Googleさんの Teachable Machine に関する記事 ⇒ 全4回のうち 2回目まで月刊I/O に掲載済
いきなり余談から
最近作ってみたものの1つ ビジュアルプログラミング を使って刀(ダイソーで 200円)を光らせる
イベント中にさくっと試作したもの Scratch 3.0 のビデオ モーションセンサーを 使って花火を打ち上げ
以前、雑にピクトグラムになってみたやつ ビジュアルプログラミング を使って(Scratch 3.0+独自 拡張「PoseNet2Scratch」)
ガジェットを使うものとか インタラクティブな作品が好き
面白そうと思うものに 幅広く手を出してみたりする
ちょこちょこ動画をアップしています ここ 2ヶ月の間に作ってアップしたもの
ここ2ヶ月の動画に関連するキーワード p5.js、MediaPipe Holistic、Scratch 3.0、M5stamp Pico、MQTT、 micro:bit、MakeCode、Grove、LEDテープ、Alexa、toio、 アルファチャンネル付動画、色画用紙の工作あそび・しかけ付カード、 Arduino MKR Wifi
1010、MediaPipe Selfie Segmentation、 Handtrack.js、MediaPipe Pose、PoseNet2Scratch、Node-RED、 はじめてゲームプログラミング、MediaPipe Hands、M5Stack、UIFlow
その中で頻出している「MediaPipe」 p5.js、MediaPipe Holistic、Scratch 3.0、M5stamp Pico、MQTT、 micro:bit、MakeCode、Grove、LEDテープ、Alexa、toio、 アルファチャンネル付動画、色画用紙の工作あそび・しかけ付カード、 Arduino MKR Wifi
1010、MediaPipe Selfie Segmentation、 Handtrack.js、MediaPipe Pose、PoseNet2Scratch、Node-RED、 はじめてゲームプログラミング、MediaPipe Hands、M5Stack、UIFlow
今日の本題の1つ
「MediaPipe」とは? ・Googleさんが提供している機械学習を使った仕組み ・Python用やスマホ用、C++用などが提供されている ・MediaPipe の JavaScript版(TensorFlow.jsベース) ・Face Mesh ・Face Detection
・Hands ・Holistic ・Pose ・Selfie Segmentation など...
認識できる対象の例(一部抜粋) Hands Face Mesh
認識できる対象の例(一部抜粋) Holistic Selfie Segmentation
自分がよく使う機械学習系の技術 (Teachable Machine も好き)
JavaScript版は ブラウザ上で動作
実現できることの例
人と背景とを分離(Selfie Segmentation) 普通の PC内蔵カメラで 撮った画像で人と背景を 分離、その間に描画
背景分離の別パターン 人と背景との間への描画
両手のキーポイントを認識(Hands) 両手の位置と距離によって 立方体の描画位置と 大きさが変化
手のキーポイント認識の別パターン 動画の中に動画 + 指先の位置に...
手のキーポイント認識の別パターン2 指を曲げているか 伸ばしているかによって 画像表示を ON/OFF
顔・手・姿勢の認識(Holistic) 目・口の動きと体の 揺れをイラストに反映 (ほぼ顔の認識しか...)
デモ動画に共通すること
認識の処理と一緒に使っているのは...
今日の本題のもう1つ 描画(p5.js)
JavaScriptの描画ライブラリ「p5.js」 メディアアート系などで有名な Processing の JavaScript版 •home | p5.js https://p5js.org/
•p5.js Web Editor https://editor.p5js.org/ •OpenProcessing https://openprocessing.org/ オンラインで開発 できる環境も
2Dだけでなく3Dも 公式リファレンス
3D描画の例
余談2: ブラウザで動くので...
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
BLEと組み合わせると、例えば... カメラでとらえた人の動き (手の動き)とガジェット の動きを連動
ブラウザのデバイス系APIでの通信 ・ブラウザから BLE・シリアル通信で制御 ⇒ toio・M5Stack・micro:bit 等に対して使った例 手の動きに連動した 6台の toio の同時制御
M5Stack Core2 へ 文字送信・表示、 画面の色変更 micro:bit の加速度 (XYZ)のグラフ化
終わり!