Upgrade to Pro — share decks privately, control downloads, hide ads and more …

慣性センサログの効果的な可視化と分類手法について

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 慣性センサログの効果的な可視化と分類手法について

Avatar for Masato MIWADA

Masato MIWADA

October 19, 2024
Tweet

More Decks by Masato MIWADA

Other Decks in Technology

Transcript

  1. 成果物について • 慣性センサから得られた561種類×5618件のログデータから人の 動作予測をするモデル。 • 正答率(Cross Validation:CV)= 98.3%、LB(Leader Board)= 98.3%

    04/22 04/23 04/24 04/25 04/26 04/27 04/28 04/29 04/30 05/01 05/02 05/03 05/04 05/05 05/06 05/07 05/08 05/09 05/10 05/11 05/12 05/13 05/14 05/15 05/16 05/17 05/18 05/19 05/20 05/21 05/22 05/23 05/24 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 成果物の作成 課題の調査 特徴量の影響を調べる ポートフォリオ作成 文書作成 コードの整理 勉強会スライド作成 (t-SNEについて) 発表会スライド作成 類似問題について調べる 出典元の文献を調べる モデル作成 SVCモデルを作成・評価 する SVCモデルをチューニン グする GBMモデルを作成・評価 する GBMモデルをチューニン グする DNNモデルを作成・評価 する DNNモデルをチューニン グする EDA 与データの構造を確認する 欠損値の割合を調べる t-SNEで調査する テーブルデータ分類 Scikit-learn LightGBM TensorFlow 活動センサーログからの 動作予測 成果物種類 ツール 利用するコンペ 行動 工程 細目 • 事前調査:4日(12時間) • 試作品(精度が出るまで):3日(8時間) • データ構造の調査や考察:3日(8時間) • 文書作成:12日(32時間)
  2. 1. 背景(慣性センサログとモデルの重要性) • 近年、より小型な慣性センサの製造が可能になり、様々な場面で の人や物の動きについての記録の取得が容易となっている。 • 記録データ活用(動作予測)は、ますます社会で重要となってくる。 (例) 1. 産業用ロボット、工作機械の動作予測

    → 運動・姿勢の維持、異常検知 2. ウェアラブル端末による、人の動作予測 → 医療分野への活用 3. インフラ構造物(鉄橋、高速道路)の維持管理 → 車両走行時の振動数や変位等 加速度センサIC(Kionix Technology):ローム株式会社 https://www.rohm.co.jp/products/sensors- mems/accelerometer-ics
  3. 1. 背景(動作予測モデルにおける課題点) • 結果に対して、高い精度が求められる。 (例) 1. 製造:機械の異常をすぐに検知し、該当箇所の同定に貢献 2. 医療:装着者の重篤な状況を見逃さない •

    一方で、誤検知も防ぐ必要がある。 (例) 1. 製造:現場における製造の流れを止めない 2. 医療:誤検知による医療現場への負担を高めない
  4. 1. 背景(動作予測モデルにおける課題点) • 結果に対して、高い精度が求められる。 (例) 1. 製造:機械の異常をすぐに検知し、該当箇所の同定に貢献 2. 医療:装着者の重篤な状況を見逃さない •

    一方で、誤検知も防ぐ必要がある。 (例) 1. 製造:現場における製造の流れを止めない 2. 医療:誤検知による医療現場への負担を高めない 動作予測をする学習モデルには、 高い検出力 誤りが少ない 高い精度が要求される
  5. 2. 学習に用いたデータと題材について スマートフォンの慣性センサログから人間の動作予測をする • データソース https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones • 学習モデルの試験に利用したデータコンペ Signate, 【練習問題】活動センサーログからの動作予測,

    https://signate.jp/competitions/116#Other • データセットの説明 慣性センサログから得られたデータに信号処理などを施して用意された 561の特徴量から、6つの行動パターンを分類する。(n=5149) 特徴量の大まかな分類 • 身体加速度計(xyz軸ごと) • 重力加速度計(xyz軸ごと) • 加加速度(加速度の時間微分値)データ(3軸) • 角運動量データ(3軸) 上記のそれぞれに対する周波数データ× 各種統計量(平均、絶対値、信号エントロピー等) precision recall f1 LAYING 1 1 STANDING 0.96 0.96 SITTING 0.96 0.96 WALKING 0.99 1 WALKING_UPSTAIRS 0.99 0.99 WALKING_DOWNSTAIRS 1 0.99 目的変数
  6. 2. 学習に用いたデータと題材について スマートフォンの慣性センサログから人間の動作予測をする • データソース https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones • 学習モデルの試験に利用したデータコンペ Signate, 【練習問題】活動センサーログからの動作予測,

    https://signate.jp/competitions/116#Other • データセットの説明 慣性センサログから得られたデータに信号処理などを施して用意された 561の特徴量から、6つの行動パターンを分類する。(n=5149) precision recall f1 LAYING 1 1 STANDING 0.96 0.96 SITTING 0.96 0.96 WALKING 0.99 1 WALKING_UPSTAIRS 0.99 0.99 WALKING_DOWNSTAIRS 1 0.99 目的変数
  7. 3. 結果(各モデル手法の精度) 学習モデルを • Support Vector Machine Classification(SVC) • Deep

    Neural Network(DNN) • Gradient Boosting Method(GBM) の3種類で作製し、比較したところSVCが最も精度が高かった。 (なお、それぞれのモデルにはチューニングを施している) SVC DNN GBM CV 0.983 0.963 0.959 LB 0.983 0.976 0.971 CV:Cross Validation 検証データでの正解率(Accuracy) LB : Leader Board コンペでの正解率(Accuracy)
  8. 3. 結果(SVCモデルについて 1/2) • 全体として98%以上と高い正答率を保ちながら、誤検知も少ない動 作予測ができている(f1-scoreを参照) • 一方で「STANDING」と「SITTNG」の精度が相対的に悪い precision recall

    f1-score support LAYING 1 1 1 1016 STANDING 0.96 0.96 0.96 895 SITTING 0.96 0.96 0.96 926 WALKING 0.99 1 0.99 853 WALKING_UPSTAIRS 0.99 0.99 0.99 682 WALKING_DOWNSTAIRS 1 0.99 0.99 777 accuracy 0.98 5149 macro avg 0.98 0.98 0.98 5149 weighted avg 0.98 0.98 0.98 5149
  9. 4. 作成スケジュール 04/22 04/23 04/24 04/25 04/26 04/27 04/28 04/29

    04/30 05/01 05/02 05/03 05/04 05/05 05/06 05/07 05/08 05/09 05/10 05/11 05/12 05/13 05/14 05/15 05/16 05/17 05/18 05/19 05/20 05/21 05/22 05/23 05/24 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 土 日 月 火 水 木 金 成果物の作成 課題の調査 特徴量の影響を調べる ポートフォリオ作成 文書作成 コードの整理 勉強会スライド作成 (t-SNEについて) 発表会スライド作成 類似問題について調べる 出典元の文献を調べる モデル作成 SVCモデルを作成・評価 する SVCモデルをチューニン グする GBMモデルを作成・評価 する GBMモデルをチューニン グする DNNモデルを作成・評価 する DNNモデルをチューニン グする EDA 与データの構造を確認する 欠損値の割合を調べる t-SNEで調査する テーブルデータ分類 Scikit-learn LightGBM TensorFlow 活動センサーログからの 動作予測 成果物種類 ツール 利用するコンペ 行動 工程 細目 • 事前調査:4日(12時間) • 試作品(精度が出るまで):3日(8時間) • データ構造の調査や考察:3日(8時間) • 文書作成:12日(32時間)
  10. 5. 開発環境 • Anaconda3 ➢Python 3.11 ✓matplot lib 3.5 ✓numpy

    1.21 ✓Pandas 2.0 ✓Scikit-learn 1.4 ✓Optuna 3.6 ✓LightGBM 3.3 • 仮想環境(tqdml) ➢ Python 3.9 ✓Tensorflow(-directml) 2.16 ✓Keras-tuner 1.4 Lenovo 「IdeaPad Flex 5 14ALC7 (2022年製)」 (Windows11 HOME) 演算装置:AMD Ryzen 7 5700U with Radeon Graphics 1.80 GHz ➢Frequency ( Base:1.8GHz, Max 4.3GHz ) ➢Cores : 8, Threads : 16, Cache : 4MB L2 / 8MB L3 ソフトウェア ハードウェア
  11. 参考文献等の一覧(1/3) 公式情報 • Tensorflow公式リファレンス(日、英) ・・・ https://www.tensorflow.org/ • Scikit-learn公式ドキュメント(英) ・・・ https://scikit-learn.org/stable/user_guide.html

    • Optuna ・・・ https://optuna.org/ • Keras-tuner ・・・ https://keras.io/keras_tuner/ ブログなど • Qiita(日) ・・・ https://qiita.com/ • teratail(日) ・・・ https://teratail.com/ • Stack Overflow(日、英) ・・・ https://stackoverflow.com/ • Kaggle(英) ・・・ https://www.kaggle.com/ • Analytics Vidhya(英) ・・・ https://www.analyticsvidhya.com/blog/ • Medium(英) ・・・ https://medium.com/ • GitHub(日、英) ・・・ https://github.com
  12. 参考文献一覧(2/3) 1. Laurens van der Maaten , Geoffrey Hinton ,

    "Visualizing Data using t-SNE", Journal of Machine Learning Research, https://lvdmaaten.github.io/publications/papers/JMLR_2008.pdf, 2008.11 2. @g-k氏, Qiita, "t-SNEを理解して可視化力を高める”, https://qiita.com/g- k/items/120f1cf85ff2ceae4aba , 2021.10.08(最終アクセス2024.05.15) 3. @sakami氏, Qiita, "t-SNE解説", https://qiita.com/sakami/items/bb466161489771f7d2e9 , 2020.08, (最終アクセス2024.05.15) 4. @hkharmfulbear氏, Qiita, "次元圧縮を片っ端から試してみた(t-SNE, PCA, MDS, UMAP)", https://qiita.com/hkharmfulbear/items/a19dff8f3c637fa3bc12, 2022.03, (最終アクセス2024.05.15) 5. @kenmatsu4(まつけん)氏, Qiita, "Variational Autoencoder徹底解説", https://qiita.com/kenmatsu4/items/b029d697e9995d93aa24, 2017.06,(最終アクセス2024.05.15) 6. データ化学工学研究室(金子研究室)@明治大学 理工学部 応用化学科, "t-distributed Stochastic Neighbor Embedding (t-SNE) ~データの可視化に特化した手法~", https://datachemeng.com/tsne/ , (最終アクセス2024.05.15)
  13. 参考文献一覧(3/3) 7. 室田 一雄, 東京大学計数工学科及び数理情報学専攻 - 俯瞰講義 (数理の世界 第 7回)

    , "最適化の 数理—応用数理の視点", https://ocw.u-tokyo.ac.jp/lecture_files/gf_06/7/notes/ja/07murota.pdf, 2007.06 8. Leland McInnes, John Healy, James Melville, "UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction", https://arxiv.org/abs/1802.03426, 2018. 9. Narayan, A., Berger, B. & Cho, H. "Assessing single-cell transcriptomic variability through density- preserving data visualization." Nature Biotechnology, https://www.nature.com/articles/s41587-020- 00801-7 , 2021 • データソース https://archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones • 引用元 Davide Anguita, Alessandro Ghio, Luca Oneto, Xavier Parra and Jorge L. Reyes-Ortiz. "A Public Domain Dataset for Human Activity Recognition Using Smartphones". 21th European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, ESANN 2013. Bruges, Belgium 24- 26 April 2013.