Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ブラウザ上でリアルタイム画像認識と認識結果に連動した描画(MediaPipeとp5.js) /...
Search
you(@youtoy)
PRO
September 03, 2021
Technology
0
910
ブラウザ上でリアルタイム画像認識と認識結果に連動した描画(MediaPipeとp5.js) / xTech ゆるっとLT (202109)
you(@youtoy)
PRO
September 03, 2021
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
AIエージェント開発用SDKとローカルLLMをLINE Botと組み合わせてみた / LINEを使ったLT大会 #14
you
PRO
0
16
ブラウザで CircuitPython の開発:公式の「CircuitPython Code Editor」を試した / 【屋形船開催】IoT縛りの勉強会! IoTLT vol.126 @東京湾
you
PRO
0
110
公開初日に個人環境で試した Gemini CLI 体験記など / Gemini CLI実験レポート
you
PRO
3
2.5k
Webの技術とガジェットで那須の子ども達にワクワクを! / IoTLT_20250720
you
PRO
0
140
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you
PRO
0
2.5k
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
170
総額200円の入力インターフェースで年齢問わず楽しめる体験型展示 / エンジニアの自由研究発表会vol.10
you
PRO
0
300
Node−RED で Ollama を使ったローカルLLM(node-red-contrib-ollamaを利用) / ビジュアルプログラミングIoTLT vol.20
you
PRO
0
230
AIエージェント開発や最新の生成AIのAPI利用などJavaScriptで色々やってみる / IoTLT vol.123
you
PRO
0
130
Other Decks in Technology
See All in Technology
エニグモ_会社紹介資料(エンジニア職種向け).pdf
enigmo_hr
0
2.2k
AWSで推進するデータマネジメント
kawanago
0
1.1k
おやつは300円まで!の最適化を模索してみた
techtekt
PRO
0
280
ヘブンバーンズレッドにおける、世界観を活かしたミニゲーム企画の作り方
gree_tech
PRO
0
540
「何となくテストする」を卒業するためにプロダクトが動く仕組みを理解しよう
kawabeaver
0
180
ヒューリスティック評価を用いたゲームQA実践事例
gree_tech
PRO
0
540
Language Update: Java
skrb
2
260
生成AI時代のデータ基盤設計〜ペースレイヤリングで実現する高速開発と持続性〜 / Levtech Meetup_Session_2
sansan_randd
1
140
なぜスクラムはこうなったのか?歴史が教えてくれたこと/Shall we explore the roots of Scrum
sanogemaru
3
950
Agile PBL at New Grads Trainings
kawaguti
PRO
1
280
まだ間に合う! StrandsとBedrock AgentCoreでAIエージェント構築に入門しよう
minorun365
PRO
11
920
なぜテストマネージャの視点が 必要なのか? 〜 一歩先へ進むために 〜
moritamasami
0
120
Featured
See All Featured
The Straight Up "How To Draw Better" Workshop
denniskardys
236
140k
Making Projects Easy
brettharned
117
6.4k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Six Lessons from altMBA
skipperchong
28
4k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
580
Designing for Performance
lara
610
69k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.1k
We Have a Design System, Now What?
morganepeng
53
7.8k
Reflections from 52 weeks, 52 projects
jeffersonlam
352
21k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4k
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
Transcript
ブラウザ上でリアルタイム画像認識と 認識結果に連動した描画(MediaPipeとp5.js) 2021年9月3日 (金) xTech ゆるっとLT: Fukuoka.php and AR_Fukuoka @オンライン
豊田 陽介 ( @youtoy )
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 自宅にたくさん ビジュアルプログラミング、 IoT関連、その他の複数の コミュニティを主催 ガジェット好き その他 IT系イベント主催、登壇や運営なども
子ども向けの活動いろいろ(IT系以外も) プライベートでの活動
技術雑誌で連載中(機械学習関連) ・Googleさんの Teachable Machine に関する記事 ⇒ 全4回のうち 2回目まで月刊I/O に掲載済
いきなり余談から
最近作ってみたものの1つ ビジュアルプログラミング を使って刀(ダイソーで 200円)を光らせる
イベント中にさくっと試作したもの Scratch 3.0 のビデオ モーションセンサーを 使って花火を打ち上げ
以前、雑にピクトグラムになってみたやつ ビジュアルプログラミング を使って(Scratch 3.0+独自 拡張「PoseNet2Scratch」)
ガジェットを使うものとか インタラクティブな作品が好き
面白そうと思うものに 幅広く手を出してみたりする
ちょこちょこ動画をアップしています ここ 2ヶ月の間に作ってアップしたもの
ここ2ヶ月の動画に関連するキーワード p5.js、MediaPipe Holistic、Scratch 3.0、M5stamp Pico、MQTT、 micro:bit、MakeCode、Grove、LEDテープ、Alexa、toio、 アルファチャンネル付動画、色画用紙の工作あそび・しかけ付カード、 Arduino MKR Wifi
1010、MediaPipe Selfie Segmentation、 Handtrack.js、MediaPipe Pose、PoseNet2Scratch、Node-RED、 はじめてゲームプログラミング、MediaPipe Hands、M5Stack、UIFlow
その中で頻出している「MediaPipe」 p5.js、MediaPipe Holistic、Scratch 3.0、M5stamp Pico、MQTT、 micro:bit、MakeCode、Grove、LEDテープ、Alexa、toio、 アルファチャンネル付動画、色画用紙の工作あそび・しかけ付カード、 Arduino MKR Wifi
1010、MediaPipe Selfie Segmentation、 Handtrack.js、MediaPipe Pose、PoseNet2Scratch、Node-RED、 はじめてゲームプログラミング、MediaPipe Hands、M5Stack、UIFlow
今日の本題の1つ
「MediaPipe」とは? ・Googleさんが提供している機械学習を使った仕組み ・Python用やスマホ用、C++用などが提供されている ・MediaPipe の JavaScript版(TensorFlow.jsベース) ・Face Mesh ・Face Detection
・Hands ・Holistic ・Pose ・Selfie Segmentation など...
認識できる対象の例(一部抜粋) Hands Face Mesh
認識できる対象の例(一部抜粋) Holistic Selfie Segmentation
自分がよく使う機械学習系の技術 (Teachable Machine も好き)
JavaScript版は ブラウザ上で動作
実現できることの例
人と背景とを分離(Selfie Segmentation) 普通の PC内蔵カメラで 撮った画像で人と背景を 分離、その間に描画
背景分離の別パターン 人と背景との間への描画
両手のキーポイントを認識(Hands) 両手の位置と距離によって 立方体の描画位置と 大きさが変化
手のキーポイント認識の別パターン 動画の中に動画 + 指先の位置に...
手のキーポイント認識の別パターン2 指を曲げているか 伸ばしているかによって 画像表示を ON/OFF
顔・手・姿勢の認識(Holistic) 目・口の動きと体の 揺れをイラストに反映 (ほぼ顔の認識しか...)
デモ動画に共通すること
認識の処理と一緒に使っているのは...
今日の本題のもう1つ 描画(p5.js)
JavaScriptの描画ライブラリ「p5.js」 メディアアート系などで有名な Processing の JavaScript版 •home | p5.js https://p5js.org/
•p5.js Web Editor https://editor.p5js.org/ •OpenProcessing https://openprocessing.org/ オンラインで開発 できる環境も
2Dだけでなく3Dも 公式リファレンス
3D描画の例
余談2: ブラウザで動くので...
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
JavaScriptで外部デバイスとの通信 ブラウザ上で実行 Node.js ・Web Serial ・Web Bluetooth ・Fetch API ・axios等を利用
・WebSocket API ・MQTT.js等を利用 ・Node Serialport ・noble・bleno ・Fetch API ・axios等を利用 ・ws等を利用 ・MQTT.js等を利用 シリアル通信 BLE HTTPリクエスト WebSocket MQTT
BLEと組み合わせると、例えば... カメラでとらえた人の動き (手の動き)とガジェット の動きを連動
ブラウザのデバイス系APIでの通信 ・ブラウザから BLE・シリアル通信で制御 ⇒ toio・M5Stack・micro:bit 等に対して使った例 手の動きに連動した 6台の toio の同時制御
M5Stack Core2 へ 文字送信・表示、 画面の色変更 micro:bit の加速度 (XYZ)のグラフ化
終わり!