Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習による動作認識
Search
OHNO
January 14, 2020
Research
0
740
機械学習による動作認識
OHNO
January 14, 2020
Tweet
Share
More Decks by OHNO
See All by OHNO
生成系AIで自データを扱うには
planeta
0
200
外観検査の難しさ
planeta
0
490
儲かるPython
planeta
0
230
画像処理ライブラリOpenCVの使い方0910
planeta
0
1.4k
Pythonによる工業用カメラ画像取得事例
planeta
0
1.3k
画像処理ライブラリOpenCVの使い方
planeta
0
970
SONYのNNC
planeta
0
580
画像類似度計算
planeta
0
1.9k
Tensorflow/Keras(Python)で作ったモデルをC++で使う
planeta
0
2.3k
Other Decks in Research
See All in Research
Adaptive fusion of multi-modal remote sensing data for optimal sub-field crop yield prediction
satai
3
190
公立高校入試等に対する受入保留アルゴリズム(DA)導入の提言
shunyanoda
0
5.2k
Cross-Media Information Spaces and Architectures
signer
PRO
0
220
LLM-as-a-Judge: 文章をLLMで評価する@教育機関DXシンポ
k141303
3
800
2025年度人工知能学会全国大会チュートリアル講演「深層基盤モデルの数理」
taiji_suzuki
23
12k
EarthMarker: A Visual Prompting Multimodal Large Language Model for Remote Sensing
satai
3
270
TRIPOD+AI Expandedチェックリスト 有志翻訳による日本語版 version.1.1
shuntaros
0
160
大規模な2値整数計画問題に対する 効率的な重み付き局所探索法
mickey_kubo
1
180
RapidPen: AIエージェントによるペネトレーションテスト 初期侵入全自動化の研究
laysakura
0
1.3k
Sosiaalisen median katsaus 03/2025 + tekoäly
hponka
0
1.2k
SSII2025 [TS1] 光学・物理原理に基づく深層画像生成
ssii
PRO
3
3.1k
Trust No Bot? Forging Confidence in AI for Software Engineering
tomzimmermann
1
230
Featured
See All Featured
Statistics for Hackers
jakevdp
799
220k
Faster Mobile Websites
deanohume
307
31k
The Cost Of JavaScript in 2023
addyosmani
49
8.3k
Balancing Empowerment & Direction
lara
1
110
Music & Morning Musume
bryan
47
6.6k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
130
19k
The Straight Up "How To Draw Better" Workshop
denniskardys
233
140k
Intergalactic Javascript Robots from Outer Space
tanoku
271
27k
Scaling GitHub
holman
459
140k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
357
30k
Code Reviewing Like a Champion
maltzj
524
40k
Done Done
chrislema
184
16k
Transcript
機械学習による動作認識 大野 宏 2020/1/11 Python機械学習勉強会in新潟Restart#10
本日の内容 ・動作認識の概要 ・センサを使った姿勢データの取得 ・ディープラーニングを使った姿勢推定 ・作業者の解析 ・主成分分析を使った動作認識
動作の取得や認識・解析の目的 ・CGキャラクター用データの取得 ・スポーツ選手やベテラン技術者の動きの違いの把握 ・作業者の解析 ・個人の特定 ・不審な動きの判別
モーションキャプチャ ・CGキャラクター用のデータの取得、スポーツ選手 の動作の解析 ・マーカを付けてモーションキャプチャーが主流
3次元センサKinect ・マイクロソフトがゲーム用のジェスチャー認識する入力 装置として開発 ・スケルトン(関節点)の3次元座標を取得できる ・工業用の3次元センサもあったが高価、Kinectは 約3万 円で(価格は1/10以下)、VGAと高解像度 ・パソコンで使えるSDKが提供され、多くの大学が研究 に利用 ・現在は製造中止、アマゾン購入可
Kinect ・画素数 512×424 ・フレームレイト 30fps ・使用範囲 0.5~4.5m ・価格 3万円くらい
Kinectの利用事例 ・ウルトラセブン https://www.youtube.com/watch?v=eCbURRDUUdI&t=46s ・かめはめ波 https://www.youtube.com/watch?v=r0l18SWKd88
安価な距離画像センサ Intel社 デプスカメラ ・画素数 1280×720 ・フレームレイト 90fps ・使用範囲 0.2~10m ・価格
3万円くらい ・大きさ 90 mm x 25 mm x 25 mm
少し高い距離画像センサ Basler社 Time-of-Flightカメラ ・画素数 640×480 ・フレームレイト 20fps ・使用範囲 0-13.325m ・精度
±1cm ・価格 40万円くらい
OpenPose ・2次元画像から姿勢を推定(関節点の2次元推定) https://qiita.com/nnn112358/items/121dc36c3c1752a00276
PoseNet https://guithub.com/tensorflow/tfjs-models/tree/master/posenet/
人体動作の認識方法 ・ディープラーニングで各関節角の値を取得 これらの値から別の機械学習方法を用いて動作を認識 各関節の動きを時系列データとしてRNNで認識 主成分分析で次元を圧縮して認識 ・3D-CNNで動画像のまま動作を認識 2D画像+1D時間 → 3D 3D
Resnet 学習に要する時間が長い
Resnet ・Residual Network ・深いネットワークの場合、誤差逆伝搬法で勾配が0近く なると消失してしまい入力層近くまで伝播されない ・複数の畳み込み層をまたぐスキップ接続を導入 ・二次元の画像認識でも高い認識率
Kinectを使った動作認識 岐阜県情報技術研究所が開発
デンソーとABEJAのシステム ・作業者の作業時間を解析する
以前取り組んだ研究の紹介 ・「固有平面上での人体動作の認識に関する研究」 ・目的 製造現場の作業工程を改善するため、現状作業を分析 する動作認識技術の開発 従来はストップウォッチを片手に人が見て紙に記録 ・動作の対象はラジオ体操 ・International Conference on
Computer Visionで発表
人体動作の認識方法 ・手順 ①人体モデルを画像にフィッティングさせ、前後のフレー ム間の特徴点(エッジ)の移動量を計算し、人の動き計算 ②各関節の回転角のデータをKL展開を使い、特徴を保 存 しつつ次元を圧縮 30次元(10パーツ×3回転角)の データを2次元まで圧縮して平面上に表示して判別
変換式式 各パーツの姿勢列を値に持つ姿勢データ行列X Xの共分散行列Q Q=XXT 次の固有方程式 λi ei =Qi ei を解き、固有値の大きい2個の固有ベクトルe1
,e2 を使い 各フレームにおける人体姿勢列は次式で固有平面上に G=[e1 ,e2 ]TX
動作の計測 4方向からのカメラで撮像して計測
2次元平面上に表された動作 伸びの動作
9種類の動作 伸びの動作 腕を回す運動
8人の伸びの動作
ICCV1999
ギリシャのケルキラ(コルフ)島
まとめ ・動作認識の概要 ・センサを使った姿勢データの取得 ・ディープラーニングを使った姿勢推定 ・作業者の解析 姿勢データを取得して機械学習で認識 動画像の3D-CNNで認識 ・主成分分析を使った動作認識
お知らせ ・ディープラーニングによる画像処理入門 Tensorflow/Kerasを使いMNISTや自前画像の分類 ローカルPC、グーグルクラウドのGPU環境 1月23日、24日 長岡市NaDeC BASE https://nagaoka-ai-innovationhub.connpass.com/event/159388/ https://connpass.com/ 「長岡市」で検索
・画像処理の基礎 カメラと照明の基礎と選定 画像処理ライブラリOpenCVの使い方講習 3/4